Mikä on semantti?

Original page: https://web.eecs.umich.edu/~rthomaso/documents/general/what-is-semantics.html

Richmond H. Thomason

Versio 1 valmistettu 1. joulukuuta 1996
Versio 2 (vähäiset tarkistukset): 27. maaliskuuta 2012

Copyright, Richmond H. Thomason, 1996
Selitys: Tämä asiakirja on pyrkimys tehdä arkinen ja hyvin ymmärrettävä tutkimusalue ymmärrettäväksi jollekin, joka ei tunne logiikkaa tai kielitietoa. Se oli alun perin kirjoitettu tietosanakirjoja varten, joka halusi jotain ulottuville myös ennen lukio-oppilasta. Mutta se ei näy missään tietosanakirjassa, koska en ollut halukas kirjoittamaan jotain editorien määrityksiin, eikä he halua muuttaa niiden eritelmiä. Tämä jakso on jälleen yksi esimerkki siitä, kuinka huonot työpaikkamantistit ovat tehneet siitä, että edes hyvin tietoiset maallikot ovat tietoisia siitä, mitä ongelmat ovat alalla.
Semantiikka on kielellisten ilmaisujen merkityksen tutkimus. Kieli voi olla luonnollinen kieli, kuten englanti tai Navajo, tai keinotekoinen kieli, kuten tietokoneohjelmointikieli. Luonnollisten kielten merkitystä tutkitaan lähinnä kielitieteilijät. Itse asiassa semantiikka on yksi nykyajan kielitieteen tärkeimmistä haaroista. Teoreettiset tietojenkäsittelytieteen tutkijat ja logistiikka ajattelevat keinotekoisia kieliä. Tietojenkäsittelytieteen tietyillä osa-alueilla nämä raja-alueet ylitetään. Esimerkiksi konekäännöksissä tietojenkäsittelytieteen tutkijat saattavat haluta liittää luonnolliset kielitekstit niiden merkitysten abstrakteihin esityksiin; tätä varten heidän on suunniteltava keinotekoisia kieliä merkitysten esittämiseksi.

Filosofiaan liittyy vahvoja yhteyksiä. Aiemmin tämän vuosisadan aikana filosofit tekivät paljon työtä semantiikassa, ja filosofit tekevät vielä merkittävää työtä.

Jokaisella, joka puhuu kieltä, on todella hämmästyttävä kyky perustella tekstien merkityksiä. Ota esimerkiksi lause

(T) I can’t untie that knot with one hand. (En voi purkaa solmua yhdellä kädellä.)

Vaikka olet luultavasti koskaan nähnyt tätä virkettä, voit helposti nähdä seuraavia asioita:

  1. Lauseke koskee kuka tahansa, joka puhui tai kirjoitti sen. (Soita tämä henkilö puhujalle.)
  2. Se on myös solmu, ehkä se, jonka kaiutin osoittaa.
  3. Lause kiistää, että kaiuttimella on tietty kyky. (Tämä on sanan ”ei” merkitys.)
  4. Vapauttaminen on tapa, jolla jotain ei sidota.
  5. Lause ei tarkoita, että solmussa on yksi käsi; se liittyy siihen, kuinka monta kättä käytetään purkamiseen.

Lauseen merkitys ei ole vain sanojensa merkitysten järjestämätön kasa. Jos näin olisi, “Cowboyt ratsastaa hevosia” ja “Hevoset ratsastavat cowboyt” merkitsisivät samaa. Meidän on siis pohdittava merkityksiä.

Tässä on järjestely, joka näyttää tuovan esiin lauseen (T) merkitysten väliset suhteet.

Ei [Minä [Pystyy [[[Tee [Ei [Sidottu]]] [Tämä solmu]] [Yhdellä kädellä]]]]

Yksikkö [Tee [Ei [Sidottu]] vastaa tässä purkamisen tekoa; se sisältää alayksikön, joka vastaa sitomattoman tilan tilaa. Suuremmat yksiköt vastaavat solmun purkamisen ja sen purkamisen-solmun-yhdellä kädellä tekoa. Sitten tämä teko yhdistää kykenevän tekemään suuremman yksikön, joka vastaa sellaisen solmun-yhdellä kädellä -olosuhteita. Tämä yksikkö yhdistää minuun, jotta ajattelen, että minulla on tämä tila – eli ajatus, että minä-voin-purkaa-solmu-yhdellä kädellä. Lopuksi tämä yhdistyy Ei-kohtaan ja saamme ajatuksen kieltämisen.

Tämä ajatus siitä, että merkitykselliset yksiköt yhdistyvät systemaattisesti muodostamaan suurempia merkityksellisiä yksiköitä ja ymmärtämään lauseita on keino kehittää näitä yhdistelmiä, on luultavasti ollut tärkein teema nykyajan semantiikassa.

Semantiikkaa tutkivat kielitieteilijät etsivät yleisiä sääntöjä, jotka tuovat esiin muodon välisen suhteen, joka on sanojen sanojen järjestely ja merkitys. Tämä on mielenkiintoista ja haastavaa, koska nämä suhteet ovat niin monimutkaisia.

Englanninkielinen semanttinen sääntö voi sanoa, että yksinkertainen lause, joka sisältää sanan ”ei”, vastaa aina merkitysjärjestelyä

Ei [Pystyy …],

mutta ei koskaan yhteen

Pystyy [Ei …].

Esimerkiksi “En voi tanssia” tarkoittaa, että en pysty tanssimaan; se ei tarkoita, että en voi tanssia.

Määrittää merkityksiä lauseet kielen, sinun täytyy tietää, mitä ne ovat. Se on tehtävä toisen alueen kielitieteen, nimeltään  syntaksin, vastata tähän kysymykseen, antamalla sääntöjä, jotka osoittavat, miten lauseet ja muita ilmaisuja rakentuvat pois pienempiin osiin, ja lopulta ulos sanoja. Merkityksessä lause ei riipu ainoastaan sanoja se sisältää, mutta sen syntaktinen meikki: lauseen

(T) That can hurt you (Se voi vahingoittaa sinua)

esimerkiksi, on epäselvä – se on kaksi erillistä merkitystä. Nämä vastaavat kaksi erillistä syntaktiset rakenteet. Eräässä rakenteessa “Se on aihe ja ‘voi’ on apuverbi (tarkoittaa”pystyä”), ja toisessa ‘jotka voivat’ on aihe ja ‘voi’ on substantiivi (osoittaen eräänlainen säiliö).

Koska lauseen merkitys riippuu niin läheisesti sen syntaktisesta rakenteesta, kielitieteilijät ovat ajatelleet paljon synteettisen rakenteen ja merkityksen välisiä suhteita; Itse asiassa todisteita epäselvyydestä on yksi tapa testata ajatuksia syntaktisesta rakenteesta.

Odottaisit semantiikan asiantuntijan tuntevan paljon siitä, mitä merkityksiä on. Mutta kielitieteilijät eivät ole suoraan vastanneet tähän kysymykseen. Tämä saattaa tuntua huonolta uutisesta semantikalle, mutta se ei oikeastaan ole niin harvinaista, että menestyvän tieteen perusajatukset pysyvät ongelmallisina: fyysikolla on todennäköisesti vaikeuksia kertoa, mikä aika on. Merkityksen luonne ja ajan luonne ovat perustekysymyksiä, joista filosofit keskustelevat.

Voimme yksinkertaistaa ongelmaa hieman sanomalla, että riippumatta merkitykset ovat, olemme kiinnostuneita kirjaimellisen merkityksen. Usein paljon enemmän kuin merkityksessä lauseen välittyy kun joku käyttää sitä. Oletetaan, että Carol sanoo ‘Minulla on opiskella’ vastauksena ‘Voitteko mennä elokuviin tänään?’. Hän tarkoittaa, että hän on tutkia, että yöllä, ja että tämä on syy, miksi hän ei voi mennä elokuviin. Mutta lause hän käytti kirjaimellisesti tarkoittaa vain, että hän on opiskeltava. Nonliteral merkityksiä tutkitaan pragmatics, ala kielitieteen joka käsittelee diskurssi ja asiayhteyteen vaikutuksia. 

Mutta mikä on kirjaimellinen merkitys? Vastauksia on neljä: (1) voit väistää kysymyksen tai (2) vedota käyttötarkoitukseen tai (3) vedota psykologiaan tai (4) käsitellä merkityksiä todellisina kohteina.

(1) Ensimmäiseen ajatukseen sisältyisi semantiikan rekonstruointi siten, että se voidaan tehdä ilman merkityksiä. On osoittautunut vaikeaksi tehdä tämä – ainakin jos haluat teorian, joka tekee mitä kielellisistä semantikoista haluaisi teoriaa. Ajatus oli kuitenkin suosittu aikaisemmin kahdennenkymmenennellä vuosisadalla, varsinkin 1940- ja 1950-luvuilla, ja siitä lähtien se on elvytetty useaan otteeseen, koska monet filosofit haluaisivat tehdä ilman merkityksiä, jos se on mahdollista. Nämä yritykset pyrkivät kuitenkin sivuuttamaan kielelliset vaatimukset, eivätkä useista teknisistä syistä ole olleet kovin onnistuneita.

(2) Kun englanninkielinen puhuja sanoo “Sataa sadetta” ja ranskalainen puhuja sanoo “Il pleut”, voit sanoa, että täällä on yhteinen käyttötapa. Mutta kukaan ei todellakaan tiedä, miten karakterisoida, mitä molemmilla lausunnoilla on yhteisiä, ilman jotenkin yhteistä merkitystä. (Tässä tapauksessa merkitys, joka sataa.) Joten tämä ajatus ei näytä todella selittävän mitä merkityksiä on.

(3) Täällä yrität selittää merkityksiä ajatuksiksi. Tämä on vanha ajatus, ja se on edelleen suosittu; nykyään se muodostaa keinotekoisen kielen, jonka on tarkoitus tarttua ideaalisen ajattelun ja puhumisen edustajan “sisäisiin kognitiivisiin esityksiin”. Tämän lähestymistavan ongelmana on, että nykyajan psykologian menetelmät eivät tarjoa paljon apua kertomaan meille yleisesti, mitä nämä sisäiset esitykset ovat. Tämä ajatus ei näytä vielä johtavan menetelmään, joka voi tuottaa toimivan semanttisen teorian.

(4) Jos sanot, että ”Marsin” merkitys on tietty planeetta, ainakin sinulla on merkityssuhde, johon voit tarttua. Sana “Mars” on toisaalta, ja toisaalta tämä iso pallo, joka kiertää auringon ympäri. Tämä selkeys on hyvä, mutta on vaikea nähdä, miten voit kattaa kaiken kielen tällä tavalla. Se ei auta meitä kovin sanomalla, mitä lauseita tarkoittaa. Ja entä Marsin muu merkitys? Meidän on uskottava roomalaiseen jumalaan sanomaan, että ”Mars” on mielekästä? Entä ”suurin määrä”?

Lähestymistapaa, että useimmat semanticists hyväksyä on yhdistelmä (1) ja (4). Käyttäen tekniikoita käytettyjen kaltaiset matemaatikot, voit rakentaa monimutkainen maailmankaikkeus abstraktin esineitä, jotka voivat toimia merkityksiä (tai merkinnöillä on) erityyppisen kielellisen ilmaisuja. Koska lauseet voivat olla joko tosi tai epätosi, merkitykset lauseet liittyy yleensä kaksi totuusarvoista tosi ja epätosi. Voit tehdä jopa keinotekoisia kieliä puhuvat näitä esineitä; Joissakin semanticists väittävät, että kielillä voidaan käyttää kuvaamaan sisäistä kognitiivisia esityksiä. Jos näin on, se myös sisältää elementtejä (3), psykologinen lähestymistapa merkityksiä. Lopuksi, rajoittamalla huomiota valittujen osien luonnollisen kielen, voit usein välttää vaikeita kysymyksiä siitä, mitä merkityksiä yleensä ovat. Siksi tämä lähestymistapa jossain määrin väistää yleistä kysymystä siitä, mitä merkityksiä ovat. Toiveena olisi kuitenkin, että kun yhä kielelliset rakenteet kuuluvat, parempi ja riittävä esityksiä merkitys nousisi esiin.

Vaikka ”totuusarvojen” voi tuntua keinotekoinen komponentteina merkitys, ne ovat erittäin kätevä puhuessaan tarkoitettuja asioita, kuten negaation; semanttinen sääntö negatiivisia lauseita sanoo, että niiden merkitykset ovat sellaisia vastaavasta positiivisesta lauseet, paitsi että totuusarvo kytketään, väärä varten tosi ja tosi varten epätosi. ‘Se ei sada’ on totta, jos ‘Sataa’ on väärä, ja epätosi, jos ‘Sataa’ on tosi.

Totuusarvojen myös yhteyden pätevyyttä ja pätevä päättelyä. (Se on voimassa päätellä lauseen S2 S1 tapauksessa S1 voisi mahdollisesti olla totta, kun S2 on epätosi.) Tämä kiinnostus voimassa päättely antaa vahvan yhteyden työskennellä semantiikan keinotekoisten kielten, koska nämä kielet ovat yleensä suunniteltu joidenkin päättely tehtävä mielessä. Loogisia kieliä on suunniteltu mallintamaan teoreettista päättelyä kuten matemaattinen todistus, kun tietokone kieliä pyritään mallintamaan erilaisia ​​yleisiä ja erityistä tarkoitusta päättelyä tehtäviä.Voimassaoloaika on hyödyllinen työskentelystä todisteita, koska se antaa meille kriteeri oikeellisuuden. On hyödyllistä pitkälti samalla tavalla tietokoneohjelmiin, jos se voidaan joskus käyttää joko osoittamaan ohjelman oikein, tai (jos todistus ei) löytää puutteita ohjelmissa.

Nämä ajatukset (jotka todella ovat peräisin logiikasta) ovat osoittautuneet erittäin voimakkaiksi teoriaa siitä, miten luonnollisen kielen lauseiden merkitykset riippuvat niiden sisältämien sanojen merkityksistä ja niiden syntaktisesta rakenteesta. Viimeisten neljänkymmenen vuoden aikana tämä on edennyt paljon, ei vain englannin, vaan myös monien eri kielten osalta. Tätä helpottaa huomattavasti se, että ihmisten kielet ovat hyvin samankaltaisia ​​sellaisissa säännöissä, joita tarvitaan ilmaisemaan merkityksiä sanoista lauseisiin; ne eroavat toisistaan ​​pääasiassa sanojensa ja niiden syntaktisten sääntöjen yksityiskohdissa.

Viime aikoina on ollut enemmän kiinnostusta leksikaaliseen semantiikkaan eli sanojen semantiikkaan. Lexical semantics ei ole niin paljon, että yritetään kirjoittaa “ihanteellinen sanakirja”. (Sanakirjat sisältävät paljon hyödyllistä informaatiota, mutta eivät oikeastaan ​​tarjoa merkityksen teoriaa tai merkitysten hyviä esityksiä.) Pikemminkin leksikaalinen semantiikka koskee systeemisiä suhteita sanojen merkityksissä ja toistuvissa kuvioissa eri merkitysten välillä. sama sana. Ei ole mitään onnettomuutta, esimerkiksi, että voit sanoa “Sam söi rypäleen” ja “Sam söi”, entinen sanoo, mitä Sam söi ja jälkimmäinen vain sanoi, että Sam söi jotain. Tämä sama kuvio esiintyy monilla verbeillä.

Logiikka on apu leksikaaliseen semantiikkaan, mutta leksikaalinen semantiikka on täynnä tapauksia, joissa merkitykset riippuvat hienovaraisesti kontekstista, ja monia yleistyksiä on poikkeuksia. (Jos jotakin vaarannetaan minun alaisani, mutta jotakin ei ymmärrä, ei ole se seistä.) Niinpä logiikka ei kanna meitä niin pitkälle kuin se näyttää kantavan meidät lauseiden semantiikkaan.

Luonnollisen kielen semantiikka on tärkeä, kun yritetään tehdä tietokoneista paremmin ihmiskieliä. Eräässä tyypillisessä sovelluksessa on ohjelma, jota ihmiset tarvitsevat. Ohjelman suorittaminen edellyttää keinotekoista kieltä (tavallisesti erikoiskomentokieli tai kyselykieli), joka kertoo tietokoneelle, miten tehdä hyödyllisiä perusteluja tai kysymyksiin vastaamista. On kuitenkin turhauttavaa ja aikaa vievää opettaa tätä kieltä kaikille, jotka saattavat haluta olla vuorovaikutuksessa ohjelman kanssa. Joten on usein syytä kirjoittaa toinen ohjelma, luonnollinen kieli, joka välittää ihmisten kielen yksinkertaisten komentojen ja tietokoneen ymmärtämän keinotekoisen kielen. Tässä ei todellakaan ole sekaannusta siitä, mitä merkitys on; merkitykset, jotka haluat liittää luonnollisiin kielikäskyihin, ovat koneen ymmärtämien ohjelmointikielen vastaavat ilmaisut. Monet tietotekniikan tutkijat uskovat, että luonnollisen kielen semantiikka on hyödyllinen tällaisten ohjelmien suunnittelussa. Mutta se on vain osa kuvaa. Osoittautuu, että useimmat englantilaiset lauseet ovat epäselviä masentavassa määrin. (Jos lauseessa on vain viisi sanaa, ja jokaisella sanalla on neljä merkitystä, tämä yksin antaa mahdollisesti 1024 mahdollista yhdistettyä merkitystä.) Yleensä vain muutama näistä mahdollisista merkityksistä on lainkaan uskottava. Ihmiset ovat erittäin hyviä keskittymään näihin uskottaviin merkityksiin ilman, että ne ovat tahattomia merkityksiä. Mutta tämä vie tervettä järkeä, ja tällä hetkellä meillä ei ole kovin hyvää ajatusta siitä, miten saada tietokoneet jäljittelemään tällaista tervettä järkeä. Tietojenkäsittelytieteen alan tutkijat, joita kutsutaan tekoälyksi, työskentelevät sen parissa. Samaan aikaan, kun luodaan luonnollisen kielen rajapintoja, voit hyödyntää sitä, että tietty sovellus (kuten vastausten noutaminen tietokannasta) rajoittaa käyttäjän todennäköisesti sanottavia asioita. Tätä ja muita älykkäitä tekniikoita käyttäen on mahdollista rakentaa erityistarkoituksessa käytettäviä luonnollisen kielen rajapintoja, jotka toimivat erittäin hyvin, vaikka olemme vielä kaukana siitä, miten saamme tietokoneet tekemään yleiskäyttöistä luonnollista kieltä.

Semantti ei luultavasti auta sinua selvittämään sanan merkitystä, jota et ymmärrä, vaikka sillä on paljon sanottavaa sanojen merkityksellisyydestä. Se ei todellakaan voi auttaa sinua ymmärtämään yhden Shakespearen sonettien merkitystä, koska runollinen merkitys on niin erilainen kuin kirjaimellinen merkitys. Mutta kun opimme lisää semantikasta, löydämme paljon siitä, miten maailman kielet vastaavat muotoja merkityksiin. Ja näin tehden opimme paljon itsestämme ja siitä, miten ajattelemme, sekä hankkimalla tietoa, joka on hyödyllinen monilla eri aloilla ja sovelluksissa.