Analyse af kvantitative data

Hvad anvendes kvantitativ analyse til? Overordnet set benyttes kvantitative analysemetoder til tre primære formål. Det kunne eksempelvis være at undersøge udbredelsen af specifikke tøjmærker eller farvepræferencer. Et andet eksempel er koblingen mellem udendørstemperatur og vælgertilslutning. Endelig kan det bruges til at teste en hypotese omkring effekten af en bestemt vaccine.

Hvordan fungerer den kvantitative tilgang? Statistiske analysemodeller udgør selve fundamentet for det kvantitative arbejde, og disse værktøjer spænder fra helt simple beregninger som gennemsnit og medianværdier til avancerede analyser såsom korrelationer og regressioner. Lyder det som det rene volapyk? Har du brug for støtte? Find ud af, hvordan Grad Coach kan assistere dig.

Sagt på en anden måde afhænger det af dine specifikke forskningsspørgsmål og målsætninger. Hvad dækker begreberne deskriptiv og inferentiel statistik over? Inden vi dykker ned i det, må vi først omkring noget grundlæggende terminologi. For at begribe forskellen på disse to statistiske grene skal man kende to centrale begreber.

Disse begreber er population og stikprøve. Lad os starte med populationen. Hvis du eksempelvis ønsker at undersøge ejere af Tesla-biler i USA, så udgør samtlige Tesla-ejere i landet din population. Den mindre gruppe af tilgængelige individer, som du rent faktisk indsamler data fra, betegnes som din stikprøve. Man kan sige, at populationen er den komplette chokoladekage, mens stikprøven blot er et enkelt stykke af kagen.

Hvorfor er denne skelnen mellem stikprøve og population så afgørende? Svaret er, at deskriptiv statistik har til formål at karakterisere stikprøven, mens inferentiel statistik forsøger at drage konklusioner om hele populationen ud fra de resultater, man finder i stikprøven. Sagt på en anden måde bruger vi én række statistiske redskaber - deskriptiv statistik - til at kigge nærmere på kagestykket, og et andet sæt værktøjer - inferentiel statistik - til at vurdere hele kagen.

Gren 1: Deskriptiv statistik Deskriptive statistikker har en enkel, men essentiel funktion i din forskning - nemlig at beskrive dit datasæt - hvilket også afspejles i navnet. De hjælper dig med at gennemskue detaljerne i din stikprøve. Alt efter dine undersøgelsesmål og problemstillinger kan det dog være, at dette er den eneste form for statistik, du har brug for.

Hvilke specifikke statistiske mål indgår typisk i dette afsnit? Nogle af de mest anvendte i denne kategori inkluderer følgende: Gennemsnit - dette er slet og ret det matematiske middel af en række tal. Median - dette repræsenterer midterpunktet i en talrække, når tallene er opstillet i numerisk rækkefølge. Ved et ulige antal observationer er medianen det tal, der står præcis i midten af sættet.

Ved et lige antal er det midterpunktet mellem de to centrale tal. Typetal - dette er den værdi, der optræder hyppigst i dit datamateriale. Standardafvigelse - dette mål fortæller, hvor stor spredningen er i dine tal. Det viser med andre ord, hvor tæt tallene ligger på gennemsnittet. Hvis de fleste værdier er tæt på middelværdien, er standardafvigelsen relativt lav. Omvendt vil en stor spredning i tallene resultere i en høj standardafvigelse.

Skævhed - som navnet antyder, beskriver dette, hvor symmetrisk fordelingen af tallene er. Det afgør, om tallene danner en jævn klokkekurve i midten, eller om de hælder mod venstre eller højre. Virker det uoverskueligt? Til venstre ses datasættet, som indeholder kropsvægten for en stikprøve på 10 individer. Til højre finder vi de deskriptive statistikker. Her fremgår det først, at gennemsnitsvægten ligger på et vist niveau.

Det betyder, at middelværdien for hele stikprøven er dette tal. Dernæst ser vi, at medianen lægger sig meget tæt op ad gennemsnittet. Dette indikerer, at dataene er nogenlunde symmetrisk fordelt - altså en balanceret fordeling af vægtmålinger centreret omkring midten. Hvad angår typetallet, findes der intet i dette specifikke datasæt.

Hvis to personer for eksempel begge vejede 65 kilo, ville dette tal udgøre typetallet. Herefter følger standardafvigelsen. Det er tydeligt, når man ser på tallene, der spænder fra 55 til 90, hvilket er en betydelig variation fra gennemsnittet. Endelig har vi skævheden. Dette giver god mening, da gennemsnit og median ikke er helt identiske.

Som det ses, giver disse deskriptive mål en værdifuld indsigt i materialet. Vær opmærksom på, at dette ikke er en udtømmende liste over alle muligheder, men blot de mest gængse. Men hvorfor er disse tal overhovedet vigtige? De er fundamentale, fordi de gør det muligt at forstå både de overordnede tendenser og de små nuancer. Endelig er de afgørende for at vælge de rette inferentielle metoder, da disse ofte kræver kendskab til dataenes skævhed, symmetri og normalfordeling.

Kort sagt er den deskriptive del fundamental, selvom teknikkerne kan virke simple. Hos Grad Coach oplever vi ofte studerende, der i deres iver efter at nå til de mere komplekse inferentielle analyser overser de deskriptive data, hvilket desværre kan føre til fejlbehæftede konklusioner. Gren 2: Inferentiel statistik Som tidligere nævnt handler deskriptiv statistik om detaljerne i dit konkrete datasæt - din stikprøve - mens inferentiel statistik sigter mod at drage slutninger om den brede population.

Hvilke former for forudsigelser er der tale om? Typisk forsøger forskere at afdække to ting via inferentiel statistik: For det første forskelle mellem grupper - såsom forskelle i højde blandt børn inddelt efter deres foretrukne måltid eller køn.

For det andet sammenhænge mellem variabler - som eksempelvis forbindelsen mellem kropsvægt og antallet af ugentlige timer brugt på yoga. Med andre ord giver korrekt udført inferentiel statistik dig mulighed for at forbinde punkterne og forudsige tendenser i den virkelige verden baseret på observationer i din stikprøve.

Derfor anvendes disse metoder til hypotesetestning - det vil sige at efterprøve antagelser om forandringer eller uligheder. Hvilke værktøjer benyttes typisk i denne gren? Først og fremmest er der T-tests. Disse bruges til at vurdere, om der er statistisk signifikant forskel på gennemsnit, spredning og skævhed mellem grupper. Metoden er særdeles effektiv til at afklare, hvor ensartede eller forskellige to datasæt reelt er.

Denne analyseform undersøger relationen mellem to variabler. Det handler om, hvorvidt en stigning i den ene variabel fører til en stigning, et fald eller ingen ændring i den anden. Et eksempel kunne være, om salget af is stiger i takt med, at gennemsnitstemperaturen går op. Til sidst har vi regressionsanalyse - som minder om korrelation ved at se på sammenhænge, men den går skridtet videre ved at undersøge årsag og virkning mellem variabler.

Her forsøger man at afgøre, om den ene variabel direkte forårsager en ændring i den anden, eller om de blot følges ad på grund af en helt tredje faktor. Statistisk overbelastning? Det er forståeligt. Resultaterne vil ofte samle sig i en diagonal linje fra nederste venstre hjørne til øverste højre. Som nævnt er dette blot et lille udpluk af de mange inferentielle teknikker, der findes.

Det er vigtigt at huske, at hver metode har sine egne forudsætninger og begrænsninger. Nogle værktøjer kræver eksempelvis normalfordelte parametriske data, mens andre er skabt til non-parametriske datasæt. Hvordan vælger man den korrekte analysemetode? For at træffe det rette valg skal man overveje to centrale faktorer: Typen af dine kvantitative data, herunder måleniveau, samt selve dataenes form.

Hvorfor er dette vigtigt? Fordi de forskellige statistiske tilgange og teknikker stiller specifikke krav til datatypen. Når dette er på plads, kan du undersøge, hvilke metoder der understøtter dine data her. En anden væsentlig faktor er dataenes fordeling. Er der tale om en normalfordeling, altså en centreret klokkekurve, eller er fordelingen skæv til en af siderne?

Forskellige teknikker er målrettet forskellige datastrukturer - nogle er beregnet til symmetri, andre til skævhed. Dette understreger igen vigtigheden af deskriptiv statistik, da den afslører alt om dataenes form. Faktor 2: Dine forskningsspørgsmål Det næste skridt er at kigge på dine konkrete problemstillinger og eventuelle hypoteser.

Karakteren af dine spørgsmål og antagelser dikterer i høj grad, hvilke statistiske greb der er de rette. Hvis du eksempelvis blot ønsker at vurdere gennemsnit og midterpunkter for variabler i en gruppe. Man bør aldrig tvinge en bestemt statistisk metode ned over sin forskning, blot fordi man foretrækker den eller kender den i forvejen.

De to hovedområder inden for statistik er den deskriptive og den inferentielle del. De mest gængse deskriptive metoder omfatter gennemsnit, median, standardafvigelse og skævhed.