Føringsgrammatikk
Føringsgrammatikk, eng., Constraint Grammar (CG), sv. restriktionsgrammatik, fi. rajoitekielioppi er eit metodologisk paradigme for analyse av naturlege språk. Føringsgrammatikken tar utgangspunkt i ein fleirtydig grammatisk analyse, der kvar ordform har alle moglege analyser. Lingvistar skriv så reglar som vel rett analyse, ut i frå konteksten ordet står i (= legg føringar på kva analyse vi kan ha). Regelsettet er kompilert til ein grammatikk som vel rett analyse. Input-analysen kan vere av ulik slag, og representere morfologi, syntaks, dependens, valens, semantikk, osb. Reglane legg til, fjernar eller erstattar analyser, etter kontekst. Konteksten kan vere definert lokalt (ein eller eit par posisjonar til høgre eller venstre for ordet), eller globalt (langt unna ordet). Kontekstvilkåra i same regel kan bli knytt saman, negert, eller blokkert av mellomliggande ord eller taggar. Ein føringsgrammatikk for eit språk består som regel av tusenvis av reglar, som blir applisert i rekkjefølgje, gruppevis. Innafor kvar gruppe blir sikre reglar brukt før usikre. Ingen reglar kan fjerne den siste analysen til eit ord, slik at ein føringsgrammatikk alltid vil gje minst ein analyse av ei kvar setning.
Føringsgrammatikkonseptet vart introdusert av Fred Karlsson i 1990 (Karlsson 1990, Karlsson et al. 1995), og det har etter det vorte skrive føringsgrammatikkar for fleire språk, som har oppnådd nøyaktigheits-F-skåre for ordklassedisambiguering på over 99%. Mange føringsgrammatikksystem har oppnådd F-skåre for syntaktiske funksjonar på 95-97%. Føringsgrammatikk kan bli brukt til å lage fulle syntaktiske trestrukturar med å legge til små frasestrukturgrammatikkar eller dependensgrammatikkar, og fleire trebankprosjekt har brukt føringsgrammatikk for automatisk analyse. Føringsgrammatikk har også vorte brukt i mange språkteknologiske program, som grammatikkontroll (m.a. for bokmål) og maskinomsetjing (m.a. for dansk-engelsk), og for ulike språkpar i Apertium-plattforma, og for interaktive pedagogiske program for samisk, jf. samisk språkteknologi.
Føringsgrammatikk er det einaste syntaktiske formalismen som har oppnådd gode nok resultat til å kunne utgjere byggesteinar i kommersielle språkteknologiske program.
[endre] Liste over føringsgrammatikksystem sortert etter språk
- Baskisk [1]
- Dansk DanGram
- Engelsk ENGCG, ENGCG-2, VISL-ENGCG
- Esperanto EspGram
- Estisk [2]
- Finsk
- Færøysk FaoDis
- Fransk FrAG
- Tysk GerGram
- Irsk online
- Italiensk ItaGram
- Katalansk CATCG
- Norsk online, Oslo-Bergen tagger (kjeldekode)
- Portugisisk PALAVRAS
- Samisk online, documentation
- Spansk HISPAL
- Svensk SWECG
- Swahili
[endre] Litteratur
- Bick, Eckhard. 2000. The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Aarhus: Aarhus University Press. ISBN 87-7288-910-1.
- Karlsson, Fred. 1990. Constraint Grammar as a Framework for Parsing Unrestricted Text. H. Karlgren, ed., Proceedings of the 13th International Conference of Computational Linguistics, Vol. 3. Helsinki 1990, 168-173.
- Karlsson, Fred, Atro Voutilainen, Juha Heikkilä, and Arto Anttila, editors. 1995. Constraint Grammar: A Language-Independent System for Parsing Unrestricted Text. Natural Language Processing, No 4. Mouton de Gruyter, Berlin and New York. ISBN 3-11-014179-5.
- Tapanainen, Pasi and Atro Voutilainen 1994: Tagging accurately: don't guess if you know. ANLC '94 Proceedings of the fourth conference on Applied natural language processing.