|
Språklig analys
|
|
|
Ett finare ord för språklig analys är datorlingvistik. Det är ett tvärvetenskapligt forskningsområde som fokuserar på användningen av datorer och databehandling för att analysera, generera och förstå naturligt språk. Det kombinerar principer och metoder från lingvistik, datavetenskap och artificiell intelligens för att lösa olika problem inom språkbehandling och språkteknologi. Genom att tillämpa datorlingvistik kan man alltså automatisera och underlätta bearbetningen av naturligt språk i olika tillämpningar, såsom automatiserad översättning, informationsåtervinning, textanalys och interaktiva språkgränssnitt. Datorlingvistik spelar en viktig roll för att förstå och behandla språkligt innehåll med hjälp av datorer och artificiell intelligens.
Datorlingvistik används för att utveckla algoritmer och modeller som kan förstå och generera naturligt språk. Det inkluderar problem som maskinöversättning, texttolkning, automatisk textgenerering, sentimentanalys och frågebesvarande system.
Datorlingvistik syftar till att skapa och hantera stora samlingar av språkdata och språkliga resurser. Det kan innefatta att utveckla lexikala databaser, korpusar (stora samlingar av autentiskt språkmaterial), morfologiska analyssystem, ordlistor och ontologier.
Datorlingvistik omfattar också studiet av taligenkänning och talbehandlingstekniker. Det innebär att utveckla system som kan omvandla tal till text, transkribera talinspelningar, och analysera och syntetisera tal på ett automatiserat sätt.
Datorlingvistik används för att utveckla språkinlärningssystem och språkteknik för att underlätta språkinlärningsprocessen. Det kan inkludera interaktiva språkinlärningsprogram, automatiserade rättningssystem och datorbaserade språktester.
Datorlingvistik syftar till att extrahera meningsfull information från text och analysera dess semantiska struktur. Det kan involvera att identifiera nyckelord, namnidentifiering, sammanfattning av text, känslighetsanalys och att extrahera relationer och entiteter från textmaterialet.
Genom att analysera språkdata; alltså information om ords och meningars längd samt vilka ord som använts mest kan man dra viktiga slutsatser för att bättre förstå en texts karaktär. En texts karaktär är hur den uppfattas. Man ser också till vilka ord som finns i en text och ordens relation till varandra. Sedan ser man till meningskonstruktion; alltså hur meningarna är bildade och deras relation till varandra. Och för att ytterligare förtydliga textens karaktär ser man till ordklasser; vilka ordklasser är över- kontra underrepresenterade. Med andra ord: vilka ordklasser dominerar? Då kan man lättare förstå en texts språkliga karaktär; alltså om den är svår- eller lättläst, om den är enkel eller komplex, omständig, eller om den är välskriven eller inte.
När man gör en språklig analys av en text så utgår man ifrån ord, ordval, ordens relation till varandra, ordens betydelse enskilt och i relation till andra ord. Om en text innehåller korta eller långa ord, lätta eller svåra ord påverkar både läsningen och förståelsen, vilket man bör poängtera i en språklig analys.
Är det många olika ord är texten ordrik, är det många långa ord är den mer komplex och är det många svåra ord kan det försvåra förståelsen. Sammansatta ord, t.ex. flaggstångsknoppsförgyllarvektyg är svårare att läsa fastän ordet är sammansatt av flertalet enkla kortare ord. Är meningarna lite längre än vanligt och texten ordrik samt att författaren ofta använder synonymer betyder det oftast att texten är välskriven.
Se till vilka ord som dominerar; alltså se till de ordklasser som det är flest av. Är det många verb så händer det mycket, är det många adjektiv är texten väldigt beskrivande och finns det många substantiv betyder det att texten innehåller många materiella ting. Och se också till hur användningen av vissa ord påverkar läsningen; händer det alltför mycket är det kanske svårt att hänga med i handlingen. Är det alltför många adjektiv kan det också överskugga själva intrigen. Är det däremot alltför få verb kanske texten känns handlingslös och innehåller den alltför få adjektiv blir det svårare att bilda sig en uppfattning hur det ser ut, hur t.ex. miljöer och personer ser ut.
Man ser också till meningsbyggnad; är meningarna korta eller långa. Korta meningar skapar ett rappare tempo medan långa drar ner tempot. En lång mening kan också uppfattas som mer svårläst eftersom man behöver hålla mer i minnet medan man läser.
Är meningarna konstruerade enligt normativ (vanliga) subjekt-predikat uppställning; t.ex. jag kör bilen: subjektet är "jag" och predikatet är "kör bilen". Det är med andra ord mer ovanligt att man säger: bilen körs av mig där ordningen är omvänd.
Är meningarna högertyngda eller vänstertyngda. Alltså se hur tidigt i meningen verbet kommer? Desto tidigare desto mer högertung och lättläst är meningen; t.ex. meningen: "Sara springer snabbare än blixten för att rädda människorna" är lättläst eftersom verbet "springer" kommer tidigt. Däremot meningen: "Snabbare än blixten, osannolikt men sant, springer Sara för att rädda människorna" som är mer svårläst.
En text ska inte heller innehålla alltför många bisatser för då blir texten mer svårläst; både när det gäller meningarnas längd och meningarnas komplexitet.
En lättläst text innehåller inte alltför många svåra ord, består mestadels av korta ord, är uppbyggd utefter subjekt-predikat, kortare meningar och högertyngd, samt få bisatser.
Sedan kan man också se till det innehållsliga genom att se hur satserna/meningarna/styckena hänger samman och om de "krokas" samman med hjälp av sammanhangsord (fogeord) eller med hjälp av upprepning med eller utan synonymer. Om det finns många fogeord och att både meningar och stycken binds samman betyder det att det finns en tydlig röd linje genom texten vilket i sin tur visar på att textförfattaren är duktig på skrivhantverket. Är texten däremot uppbyggt av många kortare meningar kan den upplevas som enkel och skriven av en mindre duktig skribent. Den är uppbyggd via sk satsradning vilket i flesta fall visar på språklig svaghet.
När man gör en språklig analys av en text så utgår man alltså ifrån ord, ordval, ordens relation till varandra, ordens betydelse enskilt och i relation till andra ord. Är det många olika ord är texten ordrik, är det många långa ord är den mer komplex och är det många svåra ord kan det försvåra förståelsen.
Är meningarna lite längre än vanligt och texten ordrik samt att författaren ofta använder synonymer betyder det oftast att texten är välskriven.
Se också till vilka ord som dominerar; alltså se till ordklasser. Är det många verb så händer det mycket, är det många adjektiv är texten väldigt beskrivande och finns det många substantiv betyder det att texten innehåller många materiella ting. Och hur användningen av vissa ord påverkar läsningen; både vad gäller innehåll, tolkning och förståelse.
Man ser också till meningsbyggnad; för det första är meningarna korta eller långa. För det andra om de är konstruerade enligt normativ subjekt-predikat uppställning. Om de är högertyngda eller vänstertyngda. Och för det tredje om de innehåller korta eller långa ord, lätta eller svåra ord. En lättläst text är uppbyggd utefter subjekt-predikat, kortare meningar och högertyngd. Och består texten av många långa ord, ibland bryter mot det normativa subjekt-predikat-upplägget samt att verbet kommer sent i meningen vilket innebär att meningen är vänstertyngd.
Sedan kan man också se till det innehållsliga genom att se hur satserna / meningarna / styckena hänger samman och om de "krokas" samman (rema-tema) med hjälp av sammanhangsord (fogeord) eller med hjälp av upprepning med eller utan synonymer. Om det finns många fogeord och att både meningar och stycken binds samman betyder det att det finns en tydlig röd tråd genom texten vilket i sin tur visar på att textförfattaren är duktig på skrivhantverket.
Läs mer om höger- och vänstertyngda meningar, Teckensystem (sats, mening, stycke), fogeord, Rema och tema, Textbindning, röd tråd,
Om du inte vill eller orkar läsa en längre text så kan du ta hjälp av matematiken när du drar slutsatser. Desto mindre bit du väljer, desto större felmarginal blir det förstås. Därför bör du vara försiktig med att plocka för lite material till din analys för då blir analysen felaktig.
Välj ca 1/10 av en roman på ca 200 sidor. Då blir underlaget ca 20 sidor. Du plockar ut statistik och tar detta gånger 10.
Välj ca 1/5 av en faktatext på ca 10 sidor. Då blir underlaget ca 2 sidor. Du plockar ut statistik och tar detta gånger 5.
Språklig analys / Summering |
|
|
Alltså:
- Vad ska man utgå ifrån när man gör en språklig analys av en text?
- Vilket slutsats kan man dra om en text är ordrik; alltså innehåller många olika ord?
- Vilket slutsats kan man dra om en text innehåller många långa ord?
- Vilket slutsats kan man dra om en text innehåller många svåra ord?
- Vilket slutsats kan man dra om en text innehåller många sammansatta ord?
- Vilket slutsats kan man dra om en text innehåller många långa meningar?
- Vilket slutsats kan man dra om en text innehåller många synonymer?
- Vilket slutsats kan man dra om en text innehåller många verb?
- Vilket slutsats kan man dra om en text innehåller många adjektiv?
- Vilket slutsats kan man dra om en text innehåller många substantiv?
- Vilket slutsats kan man dra om en text innehåller många korta meningar?
- Vilket slutsats kan man dra om en text innehåller många långa meningar?
- Vilket slutsats kan man dra om en texts meningar bryter mot den vanliga subjekt-predikat uppställning?
- Vilket slutsats kan man dra om en texts meningar är högertyngda?
- Vilket slutsats kan man dra om en texts meningar är vänstertyngda?
- Vilket slutsats kan man dra om en text innehåller många bisatser?
- Vilket slutsats kan man dra om en text innehåller många sammanhangsord, sk fogeord?
När du ska analysera din text så behöver du ta hjälp av LIX.
Du behöver också ha koll när det gäller ordklasserna.
Språklig analys / Övning 1 |
|
|
Ta hjälp av följande tabell för analysera valfri text:
Språklig analys |
Frågor du kan ställa |
01. Är texten svår att förstå? |
Varför? Vad gör den svår att förstå? |
02. Vad handlar texten om? |
Är ämnet svårbegripligt och påverkar läsningen? |
03. Hur många ord känner du inte till? |
Påverkar antalet svåra ord läsningen? |
04. Hur många ord brukar du inte använda? |
Påverkar ovanliga ord läsningen? |
05. Hur många ord finns det i texten? |
Påverkar textens längd läsningen? |
06. Hur många adjektiv finns det i texten? Innehåller texten många beskrivningar? |
Många adjektiv indikerar en mycket beskrivande text och hur påverkar detta läsningen? |
07. Hur många verb finns det i texten? Händer det mycket i texten?
|
Många verb indikerar en handlingsrik berättelse och hur påverkar detta läsningen? |
08. Hur många substantiv finns det i texten? Finns det många "saker" i texten? |
Många substantiv indikerar en materiell mångfald och hur påverkar detta läsningen? |
09. Hur många meningar finns det i texten? Är meningarna, över lag, långa eller korta? |
Hur påverkar meningarnas längd läsningen? |
10. "Krokas" meningarna samman med hjälp av medveten textbindning genom bruket av sammanhangsord (fogeord) eller upprepning? Finns det en sk röd tråd i styckena. |
Är den röda tråden lätt att följa? |
11. Hur många stycken finns det i texten? Är styckena, över lag, långa eller korta? |
Hur påverkar styckenas längd läsningen? |
12. "Krokas" styckena samman med hjälp av medveten textbindning genom bruket av sammanhangsord (fogeord) eller upprepning? Finns det en sk röd tråd genom texten. |
Är den röda tråden lätt att följa? |
13. Hur många ord på över 6 bokstäver finns det i texten? Dessa ord anses vara svårare. |
Hur påverkar antalet långa ord läsningen? |
14. Vad är den genomsnittliga meningslängden? Används, över lag, långa eller korta meningar? |
Hur påverkar meningslängden läsningen? |
15. Vad är textens läsbarhetsindex (LIX)? |
Är den mycket lättläst, lättläst, medelsvår, svår eller mycket svår? |
16. Varieras ordens längd i texten? |
Hur påverkar variationsspektrat läsningen? |
17. Används det synonymer i texten? Om så: ge minst ett exempel. |
Används synonymer för att underlätta förståelse? Eller används de främst för att förtydliga innehållet? |
18. Kan vissa ord tolkas på olika vis? Om så: ge minst ett exempel. |
Finns det ett brett eller snävt tolkningsutrymme? |
19. Är meningarna, över lag, konstruerade enligt den normativa subjekt-predikat uppställningen? |
Påverkar meningarnas uppbyggnad läsningen? |
20. Är meningarna högertyngda eller vänstertyngda? Alltså se hur tidigt i meningen verbet kommer? Desto tidigare desto mer högertung och lättläst är meningen. Och kommer den sent kräver det mer av läsaren som måste hålla information i minnet tills verbet kommer och informationen läggs in i sitt sammanhang. |
Påverkar detta läsningen? |
21. Finns det en tydlig röd tråd genom hela texten? Röd tråd visar på att det finns en medveten struktur som underlättar både läsning och förståelse. |
Finns det exempel som tydliggör att det finns en röd tråd? |
Extra A: Leta rätt på tre prefix. |
Är det fler prefix än suffix så är texten mer formell. |
Extra B: Leta rätt på tre suffix. |
Extra C: Finns det bildspråk (t.ex. metaforer eller liknelser) i texten? Om så: ge minst tre exempel. |
Påverkar bruket av bildspråk läsningen? |
Språklig analys / Övning 2 |
|
|
Ta hjälp av följande tabell för att analysera valfri text:
Språklig analys |
Resultat |
01. Är texten svår att förstå? |
|
02. Vad handlar texten om? |
|
03. Hur många ord känner du inte till? |
|
04. Hur många ord brukar du inte inte använda? |
|
05. Hur många ord finns det i texten? |
|
06. Hur många adjektiv finns det i texten? Innehåller texten många beskrivningar? |
|
07. Hur många verb finns det i texten? Händer det mycket i texten?
|
|
08. Hur många substantiv finns det i texten? Finns det många "saker" i texten? |
|
09. Hur många meningar finns det i texten? Är meningarna, över lag, långa eller korta? |
|
10. "Krokas" meningarna samman med hjälp av sammanhangsord (fogeord) eller upprepning? |
|
11. Hur många stycken finns det i texten? Är styckena, över lag, långa eller korta? |
|
12. "Krokas" styckena samman med hjälp av sammanhangsord (fogeord) eller upprepning? |
|
13. Hur många ord på över 6 bokstäver finns det i texten? |
|
14. Vad är den genomsnittliga meningslängden? Används, över lag, långa eller korta meningar? |
|
15. Vad är textens läsbarhetsindex (LIX)? Är den mycket lättläst, lättläst, medelsvår, svår eller mycket svår? |
|
16. Varieras ordens längd i texten? |
|
17. Används det synonymer i texten? Om så: ge minst ett exempel. |
|
18. Kan vissa ord tolkas på olika vis? Om så: ge minst ett exempel. |
|
19. Är meningarna, över lag, konstruerade enligt den normativa subjekt-predikat uppställningen? |
|
20. Varför är texten lätt/svår att förstå? Ta hjälp av din språkliga analys (01 - 19). |
|
Extra A: Leta rätt på tre prefix. |
|
Extra B: Leta rätt på tre suffix. |
|
Språklig analys / Övning 3 |
|
|
Analysera textutdrag ur Flickan med svavelstickorna av H.C. Andersen
Det var så rysligt kallt, det snöade och började bli mörka kvällen; det var också den sista kvällen på året, nyårsafton. I den kylan och i det mörkret gick på gatan en fattig flicka med bart huvud och bara fötter. Ja, hon hade ju haft tofflor, när hon gick hemifrån, men vad hjälpte det! Det var mycket för stora tofflor, hennes mor hade sist använt dem, så stora var de, och dem tappade den lilla, då hon skyndade sig över gatan, just som två vagnar körde förbi i väldig fart. Den ena toffeln kunde hon inte hitta och den andra sprang en pojke bort med, han sa, att han kunde använda den till vagga, när han själv fick barn.
Där gick nu den lilla flickan på sina bara små fötter, som var röda och blå av köld. I ett gammalt förkläde bar hon en mängd svavelstickor och en bunt gick hon med i handen. Ingen hade på hela dagen köpt av henne, ingen hade gett henne en liten slant, hungrig och frusen gick hon och såg så ynklig ut, den lilla stackaren! Snöflingorna föll i hennes långa gula hår, som lockade sig så vackert i nacken, men hon tänkte sannerligen inte på lockarna. I alla fönster lyste ljusen, och så luktade det här på gatan så härligt av gåsstek; det var ju nyårsafton, ja, det tänkte hon på.
Borta i ett hörn mellan två hus, det ena sköt fram litet längre på gatan än det andra, där satte hon sig och kröp ihop. De små benen hade hon dragit opp under sig, men hon frös ännu mer, och hon tordes inte gå hem, hon hade ju inte sålt några svavelstickor, inte fått en enda slant, hennes far skulle slå henne, och kallt vara det också hemma, de hade bara taket rätt över sig, och där pep vinden in, fastän man hade stoppat halm och trasor i de största springorna. Hennes små händer var nästan alldeles döda av köld. Å, en liten svavelsticka skulle göra gott. Om hon bara tordes dra ut en ur bunten, stryka den mot väggen och värma fingrarna. Hon drog ut en, ritsch! vad den sprakade, vad den brann! Det var en varm, klar låga, liksom ett litet ljus, då hon höll handen kring den. Det var ett underligt ljus, den lilla flickan tyckte, att hon satt framför en stor järnkamin med blanka mässingskulor och mässingsspjäll. Elden brann så härligt, värmde så skönt. Nej vad var det! - Den lilla sträckte redan ut fötterna för att värma dem också - - då släcktes lågan. Kakelugnen försvann - hon satt med en liten stump av den utbrända svavelstickan i handen.
Stycke 1
"Innan vi börjar måste vi förstå texten genom närläsning av texten: “Det var så rysligt kallt, det snöade och började bli mörka kvällen; det var också den sista kvällen på året, nyårsafton. I den kylan och i det mörkret gick på gatan en fattig flicka med bart huvud och bara fötter. Ja, hon hade ju haft tofflor, när hon gick hemifrån, men vad hjälpte det! Det var mycket för stora tofflor, hennes mor hade sist använt dem, så stora var de, och dem tappade den lilla, då hon skyndade sig över gatan, just som två vagnar körde förbi i väldig fart. Den ena toffeln kunde hon inte hitta och den andra sprang en pojke bort med, han sa, att han kunde använda den till vagga, när han själv fick barn.”
Steg 1 i språkliga analysen av stycke 1
Först ser vi till hårddata med hjälp av språkstatistikverktyget www.lix.se. För att förstå upplägget bättre behöver du läsa följande information.
Texten klassas som lättläst skönlitteratur. Programmet visar på att meningslängden är ganska hög, samt antalet olika ord som används är hög.
Textens läsbarhetsindex är 36, vilket innebär att den klassificeras som lättläst, skönlitteratur, populärtidningar.
Beräkning Antal meningar (M): 5
Antal ord (O): 119 varav 82 olika ord
Antal ord med fler än 6 tecken (L): 14
Genomsnittlig meningslängd (Lm = O / M): 23,8
Andel långa ord (Lo = L / O * 100): 11,76 Läsbarhetsindex (LIX = Lm + Lo): 36
Steg 2 i språkliga analysen av stycke 1
Se till hur innehållet presenteras. med hjälp av satsradning och långa meningar samt inskjutna bisatser. Se till om meningsbyggnaden är enkel eller svår. Är meningarna byggda på grundläggande vis: subjekt och predikat ordningen: subjektet är den som gör något och predikatet är det som görs. Vanligt upplägg: “Pojken spelar fotboll” där “pojken” är subjekt och “spelar fotboll” predikat.
Subjekt (lila) = det/den som gör
Predikat (orange) = det som görs
Steg 3 i språkliga analysen av stycke 1
Plocka ut ord och kategorisera utefter ordklasser. Börja med de tre vanligaste: adjektiv, verb och substantiv. Adjektiv talar om hur saker är eller ord som du sätter skit före skitbra, skitsnygg, skithäftig etc. Verb är sånt som man kan göra hoppa, tuta, springa, köra eller ord du sätter "utav bara helvete" efter: Drack utav bara helvete, körde utav bara helvete, dansade utav bara helvete etc. Substantiv är namn på ting, såsom klocka, boll och ring eller ord som du sätter fan eller jävel efter: klockfan, gubbjävel, hammarjävel etc
Adjektiv (blå) = 9st
Verb (grön) = 22st
Substantiv (rött) = 19st
Steg 4 i språkliga analysen av stycke 1
I detta steg ska vi se till satsernas relation till varandra. Rema-tema konceptet: löper det en röd tråd genom texten. Är satser och meningar “knutna” till varandra?
Rema: rema innebär det som kommer senare i meningen, den information som är ny
Tema: tema är det första som står i meningen och relaterar till kontext, given information.
Steg 5 i språkliga analysen av stycke 1
Se till bildspråk; liknelser, metaforer, Tretalet , Synonymi och Upprepning / anafor
Steg 6 i språkliga analysen av stycke 1
Se helheter genom att jämföra delarna och göra generaliseringar baserade på information från steg 1 - 5.
Stycke 2
Gör en språklig analys av stycke 2 i grupp.
"Där gick nu den lilla flickan på sina bara små fötter, som var röda och blå av köld. I ett gammalt förkläde bar hon en mängd svavelstickor och en bunt gick hon med i handen. Ingen hade på hela dagen köpt av henne, ingen hade gett henne en liten slant, hungrig och frusen gick hon och såg så ynklig ut, den lilla stackaren! Snöflingorna föll i hennes långa gula hår, som lockade sig så vackert i nacken, men hon tänkte sannerligen inte på lockarna. I alla fönster lyste ljusen, och så luktade det här på gatan så härligt av gåsstek; det var ju nyårsafton, ja, det tänkte hon på."
Stycke 3
Gör en individuell språklig analys av stycke 3.
"Borta i ett hörn mellan två hus, det ena sköt fram litet längre på gatan än det andra, där satte hon sig och kröp ihop. De små benen hade hon dragit opp under sig, men hon frös ännu mer, och hon tordes inte gå hem, hon hade ju inte sålt några svavelstickor, inte fått en enda slant, hennes far skulle slå henne, och kallt vara det också hemma, de hade bara taket rätt över sig, och där pep vinden in, fastän man hade stoppat halm och trasor i de största springorna. Hennes små händer var nästan alldeles döda av köld. Å, en liten svavelsticka skulle göra gott. Om hon bara tordes dra ut en ur bunten, stryka den mot väggen och värma fingrarna. Hon drog ut en, ritsch! vad den sprakade, vad den brann! Det var en varm, klar låga, liksom ett litet ljus, då hon höll handen kring den. Det var ett underligt ljus, den lilla flickan tyckte, att hon satt framför en stor järnkamin med blanka mässingskulor och mässingsspjäll. Elden brann så härligt, värmde så skönt. Nej vad var det! - Den lilla sträckte redan ut fötterna för att värma dem också - - då släcktes lågan. Kakelugnen försvann - hon satt med en liten stump av den utbrända svavelstickan i handen."
Se Google-dokument: Flickan med svavelstickorna (Rema & Tema)
Innehållsförteckning |
|
|
Joni Stam (2017)
|
|
|