Lingvistikk, eller språkvitenskap, er det vitenskapelige studiet av naturlige språk og tale. Utøvere av lingvistikk kalles lingvister eller språkforskere.
Det er to viktige skillelinjer innen lingvistikken:
Teoretisk vs. anvendt: Teoretisk lingvistikk eller allmenn språkvitenskap er om prinsipper for beskrivelse av forskjellige språk og universelle aspekter ved språk; anvendt lingvistikk, eller anvendt språkvitenskap søker anvendelse av slike teorier på praktiske problemer, slik som pedagogikk, taleteknologi eller taleterapi.
Autonom vs. kulturell (disse termene er ikke veletablerte, men det finnes ikke gode alternativer): Autonom lingvistikk studerer språk og deres egenskaper i abstraksjon fra mange aspekter ved daglig språkbruk. Dette er omtrent det Ferdinand de Saussure kalte langue, og Noam Chomsky har kalt I[nternal]-language (i-språk). Kulturell lingvistikk befatter seg med det Saussure kalte parole, og Chomsky har kalt E[xternal]-language (e-språk), nemlig språk som et fenomen som eksisterer uavhengig av den enkelte språkbruker: Man studerer altså dets sosiale funksjon, eller hvordan språkbruk passer inn i en videre kontekst av menneskelig atferd.
Språkforskere som simpelthen kaller seg lingvister eller teoretiske lingvister, uten nærmere presisering, driver vanligvis med autonom, teoretisk lingvistikk, og dette er vanligvis sett på som kjernen av feltet. Men språkforskning utføres i en rekke forskjellige retninger, som ikke bestandig er i harmoni med hverandre. Den amerikanske forfatteren og frilansjournalisten Russ Rymer har sagt det slik:
Lingvistikk er trolig det mest omstridte feltet i akademia. Det er dynket i blodet til poeter, teologer, filosofer, filologer, psykologer, biologer, antropologer og nevrologer, samt hva slags blod som kan fås ut av grammatikere.
Delemner
Hovedmålet ved autonom teoretisk lingvistikk er å karakterisere egenskapene ved menneskers språkevne, eller deres språklige kunnskap. Man ønsker å forklare hva det er et individ kan når dette individet snakker et språk, hvordan denne kunnskapen oppsto, og hvordan slik kunnskap interagerer med andre kognitive systemer. Alle mennesker (dersom man ser bort fra patologiske tilfeller) tilegner seg sitt morsmål, det språket som anvendes rundt dem i deres oppvekstmiljø, om dette er et talespråk eller et tegnspråk. Dessuten oppnår de slik kunnskap uten systematisk opplæring eller instruksjon. Dyrearter det er nærliggende å sammenligne oss med, har ikke denne evnen. Det må derfor eksistere en artsspesifikk genetisk forskjell mellom mennesker og disse dyreartene, og denne forskjellen må ligge til grunn for menneskers evne til å tilegne seg språk. Dette er faktisk ukontroversielt. Det er mye mer kontroversielt om denne artspesifikke, nedarvede egenskapen bør tenkes på som en spesialisert modul av vår kognitive utrustning som kun har med språk å gjøre, altså en språkspesifikkmodul. Vi vet imidlertid at det finnes områder av hjernen som er vitale for vår evne til å ha språk, nemlig Brocas område og Wernickes område. Siden barn tilegner seg forskjellige språk dersom de vokser opp i forskjellige språkmiljøer, er det naturligvis ingen genetisk basis for forskjellene mellom et språk og et annet.
Språklige strukturer må representere relasjonen mellom betydning og lyd (eller andre metoder for eksternalisering, som i tegnspråk). Lingvister kan spesialisere seg i forskjellige deler av slike lingvistiske strukturer, og disse delene kan arrangeres slik, fra lyd til betydning:
Fonetikk, studiet av språklyder fra et fysiologisk og akustisk perspektiv
Fonologi, studiet av abstrakte strukturer og systemer for organisering av språklyder
Morfologi, studiet av den interne strukturen i ord
Syntaks, studiet av hvordan ord kan kombineres i grammatiske fraser og setninger
Semantikk, studiet av betydningen til ord, faste uttrykk, og hvordan disse kan kombineres til de komplekse betydningene til setninger
Pragmatikk, studiet av hvordan ytringer brukes i ytringskonteksten
Diskursanalyse, studiet av setninger organisert i tekster
Det er noen ganger et kontroversielt spørsmål hvilke av disse kategoriene som er uavhengige av alle de andre, og om noen av dem bør slås sammen. De fleste lingvister ville si seg enige i at det er gråsoner mellom alle disse kategoriene.
Andre spesialiseringsområder kombinerer disse feltene med andre disipliner:
Språktilegning, studiet av hvordan språktilegning fungerer
Historisk lingvistikk eller diakron lingvistikk, studiet av utviklingen av forskjellige språk over tid
Psykolingvistikk, studiet av kognitive prosesser og representasjoner som er relaterte til språkbruk
En stor del av den forskningen som blir utført innen lingvistikken går på forskjeller og likheter mellom verdens språk. Det er veldig viktig å forstå egenskapene ved språklig variasjon, dersom man skal forstå menneskers språkevne mer generelt: Hvis språkevnen er styrt i detalj av menneskeartens biologiske egenskaper, burde verdens språk være relativt like. Hvis artens biologiske egenskaper har mindre relevans for språkevnen, burde verdens språk være svært forskjellige fra hverandre.
Det finnes forskjellige måter å tolke likheter mellom språk. For eksempel latin, slik det ble snakket av romerne, utviklet seg til dagens spansk, italiensk, fransk, rumensk osv. Mange av likhetene mellom disse språkene kan derfor forklares med at de har utviklet seg fra samme urspråk. Liketer mellom to språk kan derfor i prinsippet enten komme av at de to språkene stammer fra samme urspråk, eller av en artsspesifikk egenskap ved den menneskelige språkevnen.
I mange tilfeller kan man utelukke utvikling fra samme urspråk som en mulig forklaring. Naturlige språk har sannsynligvis eksistert helt siden det moderne menneske oppsto for omtrent femti tusen år siden. Målinger av språkforandring over tid (for eksempel målinger av forskjeller mellom språkene i antikke skriftkilder og deres moderne datterspråk) viser at språk forandrer seg raskt nok til at det er fullstendig umulig å rekonstruere de språkene som ble snakket for så lenge siden. Det er derfor ikke vanlig å bruke likheter mellom språk i forskjellige deler av verden som bevis for utvikling fra samme urspråk (språkslektskap).
Det er kanskje enda mer slående at det finnes dokumenterte tilfeller av tegnspråk som utviklet seg i samfunn av arvelig døve barn som ikke hadde tilegnet seg noe annet språk (for eksempel Al-Sayyid-beduintegnspråk), og som derfor ikke kunne ha vært utsatt for talespråk. Slike tegnspråk har vist seg å dele mange av de egenskapene som kjennetegner forskjellige talespråk. Dette støtter opp under hypotesen om at slike språklige likheter bør forklares ut fra menneskers artsspesifikke biologiske utrustning, snarere en språkslektskap.
Et eksempel på en universell generalisering om språk er at det finnes en rekke språk som systematisk plasserer verbet på nest førsteplass i hovedsetninger, for eksempel norsk og tysk. Dette kalles vanligvis for V2, og nedenfor er det gitt et eksempel på dette med verbet i uthevet skrift. Det finnes derimot ingen språk som systematisk plasserer verbet på nest sisteplass.
Grammatisk: Nå tar vi oss en kopp kaffe.
Ugrammatisk: *Nå vi tar oss en kopp kaffe.
Et annet eksempel kan finnes i organiseringen av stavelser. Norsk tillater stavelser som består av en konsonant (forkortet som «K»), etterfulgt av en vokal (forkortet som «V»), som igjen følges av en konsonant (eksempel: mat; KVK). Det finnes språk som utelukkende har KV-stavelser (eksempel: ta). De tillater ikke stavelser som ender på en konsonant (KVK eller VK). Men det finnes ingen språk som utelukkende tillater VK-stavelser, stavelser som består av en vokal etterfulgt av en konsonant, altså et språk som ikke tillater stavelser som begynner på en konsonant (KVK eller KV). Norsk tillater VK-stavelser (ut), men også KV-stavelser (på).
Det ser altså ut til at det er umulig for den menneskelige språkevnen å tilegne seg språk som systematisk plasserer verbene på nest sisteplass i hovedsetninger, eller språk som systematisk forbyr stavelser som begynner på en konsonant, mens de omvendte systemene (verbet på nest førsteplass, eller forbud mot VK-stavelser) er relativt vanlige. Grovt sagt kan ansamlingen av slike universelle generaliseringer kalles den universelle grammatikken (eller UG). Dette temaet er imidlertid kontroversielt, og termen brukes på mange forskjellige måter.
Universelle språklige egenskaper (språklige universalier) kan delvis forklares som resultater av universelle egenskaper ved menneskers dagligliv. For eksempel vil alle mennesker være i jevnlig kontakt med vann, så det er ingen stor overraskelse at alle verdens språk har et ord for vann. Når man prøver å finne ut hvilke språklige universalier som stammer fra artens biologiske utrustning må man altså kontrollere for dette. Men daglige erfaringer er ikke tilstrekkelig for språktilegning, siden dyr som lever rundt mennesker ikke tilegner seg menneskespråk. Dyr kan tilegne seg eller forstå et begrenset vokabular, men forsøk med sjimpanser og andre relativt intelligente dyrearter har vist at de i beste fall er svært begrenset med hensyn til tilegning av grammatiske regler.
Skyldes egenskaper ved UG generelle egenskaper ved menneskelig kognisjon, eller egenskaper ved menneskelig kognisjon som er språkspesifikke? I dag vet vi for lite om kognisjon til å kunne stille dette spørsmålet på en presis måte. Derfor formuleres lingvistiske generaliseringer ofte uten å ta stilling til dette.
I tillegg til å bruke slike grammatiske kategorier har naturlige språk den viktige egenskapen at de organiserer elementer i rekursive strukturer. En substantivfrase kan inneholde en annen substantivfrase, og en bisetning kan inneholde en annen bisetning. Substantivfrasen kongen av Danmarks sønns favorittsjokolade er et eksempel på dette. Rekursjon var kjent i lingvistikken tidligere (for eksempel gjennom Jespersen), men det var først etter publiseringen av Noam Chomskys bok Syntactic structures[1]
i 1957 at man forsto rekkevidden av dette aspektet ved naturlige språk.
Chomsky brukte en kontekstfri grammatikk med tillegg av transformasjoner til å skrive en formell grammatikk for et fragment av engelsk. Siden har kontekstfrie grammatikker blitt skrevet for store fragmenter av forskjellige språk (for eksempel GPSG for engelsk), men det finnes nå matematiske beviser for at kontekstfrie grammatikker ikke kan takle fenomener som kryss-serielle avhengigheter, og disse finnes i naturlige språk. Dette viser altså at man trenger kraftigere mekanismer, for eksempel transformasjoner.
Et eksempel på slike kryss-serielle avhengigheter kommer fra nederlandsk:[2][3]
Ik denk dat Jan Piet de kinderen zag helpen zwemmen
Jeg tror at Jan Piet barna så hjelpe svømme
Jeg tror at Jan så Piet hjelpe barna å svømme.
Poenget er at substantivfrasene foran verbklyngen (Jan, Piet, de kinderen) avhenger av verbene i verbklyngen (zag, helpen, zwemmen) i tur og orden fra venstre til høyre.
Dette betyr at formalismer for grammatikker for naturlige språk må være relativt kraftige med hensyn til hva slags strukturer og avhengigheter de kan generere. Det finnes likevel komputasjonelle implenteringer av, blant andre, GPSG, HPSG, Kategorielle grammatikkformalismer og minimalisme.[4][5]
Detaljer om utvalgte delemner og skillelinjer
Kulturell lingvistikk
Kulturell lingvistikk omfatter studiet av lingvistikk i interaksjon med andre akademiske disipliner.
Mens teoretisk lingvistikk går ut på å finne og beskrive fenomener som kjennetegner den menneskelige språkevnen, både ved å undersøke spesifikke språk og ved å sammenligne forskjellige språk, representerer anvendt lingvistikk forsøk på å bruke slike funn til å løse problemer i andre områder. Man bruker ofte termen anvendt lingvistikk om anvendelse av lingvistikk til undervisningsformål, men resultater av lingvistisk forskning benyttes i mange andre sammenhenger også.
I mange områder av anvendt lingvistikk brukes i dag datamaskiner. Talesyntese og talegjenkjenning benytter seg av fonetisk og fonologisk kunnskap for å sette datamaskiner i stand til å interagere med mennesker ved hjelp av tale. Applikasjoner av komputasjonell lingvistikk til maskinoversettelse og naturlig språkprosessering er også veldig fruktbare områder innenfor anvendt lingvistikk som har blitt mer viktige i de senere år på grunn av kraftigere datamaskiner (datalingvistikk). Dette har påvirket teorier om syntaks og semantikk, siden modellering av slike teorier på datamaskiner begrenser valget av mulige syntaktiske og semantiske teorier til de som kun benytter seg av komputable operasjoner og har grundig matematisk fundament.
Diakron lingvistikk
Hoveddelen av teoretisk lingvistikk interesserer seg for språksystemer som modellerer et språk på et bestemt tidspunkt (vanligvis samtiden). Dette kalles synkron lingvistikk.Diakron lingvistikk, også kalt historisk lingvistikk, interesserer seg for hvordan språk forandrer seg over tid. Diakron lingvistikk har en rik historie. Selve studiet av lingvistikk som akademisk disiplin, vokste ut av diakron forskning på språkforandring. Dermed finnes det også et godt teoretisk fundament for studiet av språkforandring. Viktige historiske perspektiver på lingvistikk inkluderer historisk-komparativ lingvistikk og etymologi.
Preskriptiv vs. deskriptiv lingvistikk: «Forflatning» av språket
I dag er nesten all lingvistisk forskning deskriptiv: man ønsker å undersøke naturlige språks egenskaper uten å bedømme dem eller prøve å «forbedre» dem. Det finnes likevel mange profesjonelle og amatører som liker å «rette på» andres språkbruk og å foreskrive regler som de vil andre skal følge.
Preskriptivister finnes faktisk mest blant språklærere og journalister, og ikke blant akademikere som forsker på lingvistikk. De fastholder et skarpt skille mellom «rett» og «galt» og er ofte selvoppnevnte spesialister på dette. De ser det gjerne som en hovedoppgave å forhindre «språklig forfall». Hva som bedømmes som «forfall» kan variere fra preskriptivist til preskriptivist, men det inkluderer ofte slike ting som lånord, som kan føles truende for et språks integritet, og nærmest enhver forandring et språk går igjennom, siden disse ofte blir sett på som forenklinger av det gamle, «riktige» systemet. Et eksempel på en forandring som har skjedd eller er iferd med å skje i norsk, er skillet mellom da og når. En gammel regel sier at da brukes om spesifikke tidspunkter i fortiden, mens når kan brukes om uspesifikke tidspunkter, som ikke nødvendigvis ligger i fortiden. Dette blir ofte oppsummert i regelen «Den gang da, hver gang når». I veldig mange moderne dialekter av norsk kan når også brukes om spesifikke tidspunkter. Skillet mellom da og når er ikke helt utslettet, selv i disse dialektene, for veldig få ville bruke da om uspesifikke tidspunkter: De to setningene nedenfor kan ikke bety det samme. For de fleste er den siste enten uakseptabel, eller den kan bare brukes til å bety at ettersom noen blir alvorlig syke, kan man ringe ambulanse. Den forandringen som har skjedd er altså at når har fått litt utvidet bruksområde og preskriptivister forsøker fortsatt å snu denne og mange andre forandringer norsk er iferd med å gå igjennom.
Akseptabel: Når noen blir alvorlig syke, kan man ringe ambulanse.
Uakseptabel: *Da noen blir alvorlig syke, kan man ringe ambulanse.
Deskriptivister aksepterer ikke preskriptivistenes begrep om «feil språkbruk». De vil kanskje heller kalle det relevante fenomenet for idiosynkratisk, eller også oppdage at det nye fenomenet følger regler som simpelthen er annerledes enn de gamle. Her er et eksempel på det: En preskriptiv regel for norsk sier at man ikke skal bruke infinitivsmerket å etter modale hjelpeverb. Men en rekke norske dialekter og sosiolekter benytter systematisk infinitivsmerket etter modaler som refererer til ferdigheter, men aldri etter andre modaler. I disse dialektene, kan følgende setning bare bety at Jens har de nødvendige ferdighetene som skal til for å sykle. Den kan ikke bety at han får lov til å sykle, eller at det kan hende at Jens sykler.
Jens kan å sykle.
Hvis man ønsker å formidle en av de to andre betydningene, må man droppe infinitivsmerket, selv i disse dialektene. Dialekter som følger den relevante preskriptive reglen (aldri infinitivsmerke etter modale hjelpeverb) er altså ikke istand til å gjøre skille mellom ferdighetsbetydningen og de andre betydningene på samme måte. Det er altså vanskelig å forsvare standpunktet at de dialektene som "bryter" regelen er «mindreverdige» på noen måte, sammenlignet med de dialektene som «følger» den. I deskriptiv lingvistikk ønsker man altså å beskrive språk på en vitenskapelig måte. Verdivurderinger har ingen plass i slik forskning.
Talespråk og skriftspråk
De fleste lingvister er av den oppfatningen at talespråk er mer fundamentalt, og derfor viktigere å studere, enn skriftspråk.
Grunner til dette er:
Talespråk ser ut til å være universelt for menneskelige kulturer. Det finnes mange kulturer som har et talespråk, men som ikke har noe konvensjonelt skriftsystem.
Folk tilegner seg talespråk enklere og tidligere enn skriftspråk.
Mange innenfor kognisjonsvitenskapen argumenterer for at det finnes en medfødt språkmodul, og dersom man er interessert i å belyse denne hypotesen, vil forskning på talespråk gi bedre resultater enn forskning på skriftspråk. Dette gjelder særlig fordi talespråk anses som et resultat av artens evolusjon, mens skriftspråk er en relativt ny oppfinnelse i den sammenhengen.
Lingvister bruker selvsagt skriftspråklig kildemateriale i sin forskning, og dette anses som viktig og verdifullt. I korpuslingvistikk og datalingvistikk er skriftspråk mye enklere å bruke hvis man er interessert i å prosessere store mengder av språklige data. Store korpora med talespråk er vanskelige å lage, og når man lager slike blir ofte materialet transkribert og skrevet ned.
Studiet av skriftsystemer blir uansett ansett som en del av lingvistikken.
Lingvistikkens historie
Gammelindiskevediske tekster (Rig Veda 1:164:45; 4:58:3; 10:125) antyder en struktur for språk: Setninger er kombinasjoner av ord som har to distinkte former for eksistens (vokal form, ordet, og persepsjonell form, betydningen). Disse ordene anerkjennes for det meste som verb, som representerer handlinger i den virkelige verden, og substantiver som kan ta sju forskjellige kasus (avhengig av hvilken måte de deltar i handlinger i den virkelige verden). Antallet kasus er ikke viktig her: Idéen er at substantiver bøyes for å indikere deres deltagelsesmåte i de relevante handlingene.
SanskritgrammatikerenPāṇini (ca. 520 til 460 f.Kr.) er den første kjente lingvisten, og anerkjennes som grunnleggeren av lingvistikk. Han er mest berømt for å ha formulert de 3959 reglene for sanskrit i teksten Aṣṭādhyāyī, som fortsatt er i bruk. Pāṇinis grammatikk for sanskrit er svært systematisk og teknisk. Han benyttet seg av konsepter som fonemer, morfemer og røtter, begreper som først ble gjenoppdaget mer enn to tusen år etter hans tid. Hans grammatikk er veldig kortfattet, og er derfor kontraintuitiv og vanskelig å lese, sammenlignbart med dagens maskinspråk for datamaskiner (i motsetning til mer leselige programmeringsspråk). Hans sofistikerte logiske regler og teknikker har vært veldig innflytelsesrike i gammeldags og moderne lingvistikk.
Den sørindiske lingvisten Tolkāppiyar (omtrent det tredje århundre f.Kr) skrev teksten Tolkāppiyam, grammatikken for tamilsk, som også fortsatt er i bruk. Bhartrihari (450–510) var en annen viktig indisk lingvist. Han foreslo teorier som sa at talehandlinger består av fire stadier: Først konseptualisering av en idé; så verbalisering av denne idéen; deretter formidling av tale i luften; og til slutt tolkning av talesignalet av tilhøreren. Pāṇinis og Bhartriharis arbeider hadde stor innflytelse på mange av de grunnleggende idéene som mye senere ble foreslått av sanskritprofessoren Ferdinand de Saussure, som blir ansett som den moderne lingvistikkens opphavsmann.
I det monumentale verket Al-kitab fi al-nahw (الكتاب في النحو, Boken om grammatikk 760 e.Kr.) beskrev den persiske lingvisten Sibawayhklassisk arabisk med stor presisjon. I dette verket ble fonetikk skilt fra fonologi.
Andre innflytelsesrike lingvister er:
Jacob Grimm, som i 1822 fant prinsippet for konsonantforandringer i uttale, kjent som Grimms lov;
Edward Sapir, som var en av de første som forfulgte relasjonene mellom språk og antropologi;
Noam Chomskys formelle språkteori ble utviklet under innflytelse av hans lærer Zelig Harris, som igjen var sterkt påvirket av Leonard Bloomfield. Chomskys teori har vært dominant siden 1960-årene.
Chomsky forblir den aller mest innflytelsesrike lingvisten i dag. Lingvister som arbeider i forskningsparadigmer som HPSG eller LFG understreker gjerne betydningen av formalisering og matematisk presisjon i lingvistiske teorier, og tar en viss avstand fra Chomskys senere arbeider,[6]
men identifiserer seg mer med Chomskys tidligere arbeider. Lingvister som arbeider med optimalitetsteori uttrykker generaliseringer ved hjelp av regler som kan krenkes, noe som utgjør et større avvik fra hovedstrømningene innenfor moderne lingvistikk. Lingvister som arbeider innenfor forskjellige typer funksjonalistisk lingvistikk og kognitiv lingvistikk mener at lingvistisk kunnskap ikke er en autonom del av menneskets kognitive utrustning, og betviler påstander om at lingvistiske generaliseringer er universelle.
^Chomsky, Noam (1957): Syntactic Structures. Mouton, the Hague.
^Bresnan, Joan; Kaplan, Ronald; Peters, Stanley; og Zaenen, Annie (1982): «Cross-serial dependencies in Dutch» i: Linguistic Inquiry13, s. 613-636.
^Shieber, Stuart (1985): «Evidence against the context-freeness of natural language» i: Linguistics and Philosophy8, s. 333-344.
^Pullum, Geoffrey K. (2009) «Computational linguistics and generative linguistics: the triumph of hope over experience.» In T. Baldwin and V. Kordoni (Eds.) "Proceedings of the EACL 2009 Workshop on the Interaction between Linguistics and Computaitional Linguistics: Virtuous, Vicious or Vacuous?", Athens, Greece, pp 12-21. Association for Computational Linguistics.
Bye, Patrik , Trosterud, Trond og Vangsnes, Øystein Alexander (2003): Språk og språkvitskap: ei innføring i lingvistikk. Oslo: Det Norske Samlaget. ISBN 82-521-5911-7
Griniewicz, Sergiusz og Dubieniec, Elwira M. (2004): Introduction To Linguistics. Białystok, WSFiZ.
Hudson, G. (2000): Essential Introductory Linguistics. Oxford: Blackwell.
Lyons, John (1995): Linguistic Semantics, Cambridge University Press. ISBN 0-521-43877-2
Napoli, Donna J. (2003): Language Matters. A Guide to Everyday Questions about Language. Oxford University Press.
O'Grady, William D., Michael Dobrovolsky & Francis Katamba [red.] (2001): Contemporary Linguistics, Longman. ISBN 0-582-24691-1
Taylor, John R. (2003): Cognitive Grammar, Oxford University Press. ISBN 0-19-870033-4
Trask, R. L. (1995): Language: The Basics. London: Routledge.
Ungerer, Friedrich & Schmid, Hans-Jorg (1996): An Introduction to Cognitive Linguistics, Longman. ISBN 0-582-23966-4