Inhoudstabel:
Op deze webpagina vind je informatie over hoe je je kwantitatief onderzoek of thesis
rapporteert en over welke statistische analyses je zal nodig hebben.
Het maken van statistische analyses vereist dat je je bezig houdt met kwantitatief onderzoek.
Hoe groter je steekproef, hoe beter je resultaten normaliter zijn. Omdat de resultaten van je onderzoek
aan een minimum eis van betrouwbaarheid zouden voldoen, moet je minstens 50 enquêtes
hebben afgenomen. Het maken van statistische analyses op de gegevens van 20 personen heeft dan ook
geen enkele zin. Iemand met extreem hoge score zal je parameters voor centrale tendentie (vb. rekenkundig gemiddelde)
en voor spreiding (vb. standaardafwijking) immers enorm vertekenen waardoor je verkregen analyses niet
meer bruikbaar zijn voor het trekken van conclusies.
Aan elke kwantitatieve analyse gaat een klein literatuuronderzoek vooraf. Vooraleer je je
survey kan construeren moet je immers verdiepen in het vakgebied dat je wil bestuderen. Zo
ben je instaat een onderzoeksdoel en hypothese te formuleren die relevant is voor het vakgebied.
Een weergave van je literatuuronderzoek, de bevindingen uit andere onderzoekingen en je
onderzoekshypothesen bevinden zich in het eerste gedeelte van je thesis.
Meer informatie hierover vind je in de scriptie-handleiding die je in het
begin van dit academiejaar bij de aankoop van je boeken ontving. In deze papieren
handleiding staat er ondermeer te lezen hoe je je bronvermeldingen moet rapporteren.
Wil je toch een snelle opfrisser dan vind je op deze website hierover meer in het onderdeel
probleemstelling.
In het tweede gedeelte van je thesis beschrijf je je onderzoeksmethode op drie vlakken, namelijk je subjecten, je procedure en je meetinstrument.
In deze rubriek maak je duidelijk wie je in je onderzoek wil bereiken.
Wat is je doelgroep en waarom? Vragen zoals "wat is je populatie, wat is je steekproefkader
en wat is je steekproef" dienen hier te worden beantwoord.
In dit gedeelte beschrijf je de manier waarop je bent tewerk gegaan om je enquête
af te nemen. M.a.w. hier komt het antwoord op de vraag: "hoe heb je je steekproef bereikt?".
Gebeurde de afname individueel of in groep? Heb je gebruik gemaakt van een papieren of
elektronische versie van je enquête? Heb je je respondenten zelf aangesproken of
heb je ze uitgekozen uit een adressenlijst? Heb je publiciteit gemaakt op internet, in kranten
of op de advalvas? Was de deelname verplicht of vroeg je je respondenten om vrijwillig
deel te nemen aan je onderzoek? Op welke tijdstippen werden er enquêtes afgenomen?
In elke thesis moet je vragenlijst vermeld worden. Je geeft een overzicht van zowel de beschrijvende variabelen als je eigenlijke vragenlijst. Dit houdt in dat je weergeeft uit hoeveel vragen je vragenlijst bestaat. Soms kan het zijn dat je vragenlijst verschillende zaken meet. Het is dan goed om deze vragen die hetzelfde meten te groeperen en gezamelijk te spreken. In dit geval spreekt men meestal van subschalen die een gezamelijk construct meten en bestaan uit een reeks items.
Je duidt per vraag of groep van vragen het type van vraag aan: open of gesloten vragen,
dichotome of rating-schalen (vb. scores van 1 tot 7), enzovoort. Je maakt duidelijk wat
de beperkingen zijn van deze keuze en waarom je deze
keuze hebt gemaakt.
Bijvoorbeeld: je doet een onderzoek naar de preferentie voor een bepaald merk van koffie.
Je kiest ervoor om in een warenhuis te staan in de buurt van de koffie stand en daar iedereen
aan te spreken. Dit geeft als gevolg dat je niet zoveel tijd hebt om te interviewen. Je
respondenten zijn immers druk bezig met boodschappen doen en willen graag snel opschieten.
Je vragenlijst zal dus kort moeten zijn en liefst gebruik je gesloten vragen omdat dit
eenvoudiger is voor de respondent om te beantwoorden. Het nadeel van deze methode is
dat het veel voorbereiding van je vraagt. Je mag immers niets uit het oog verliezen.
Als je lijst met redenen waarom iemand merk Y verkiest niet exhaustief is dan zal dit
je onderzoeksresultaat vertekenen.
Wanneer je je bij de constructie van je survey hebt gebaseerd op andere vragenlijsten dan
dient dit te worden vermeld.
Bij het gebruik van een lange vragenlijst zet je deze vragenlijst in bijlage en geef je
voorbeelden van enkele belangrijke items uit je vragenlijst.
In elke survey onderzoek geef je informatie over hoeveel respondenten je vragenlijst invulden. Indien er subjecten uit de analyses werden geweerd dan moet hun aantal en de reden hiervoor worden vermeld (bvb. 5 vragenlijsten werden uit het onderzoek geweerd omdat ze meer dan 50% van de vragen niet beantwoord hadden).
Nadien moeten de respondenten beschreven worden aan de hand van hun persoonskenmerken. De volgende persoonskenmerken worden in de meeste vragenlijsten opgenomen : geslacht, leeftijd, woonplaats, nationaliteit, burgerlijke staat en beroep.
Je beschrijving van de persoonskenmerken gebeurt door een overzicht te geven van de procentuele verhoudingen in je persoonsvariabelen (vb. procentuele verhouding van alle mannen tegenover alle vrouwen in je steekproef)
In SPSS kan je een frequentietabel met bijhorende statistische paramaters zoals rekenkundig
gemiddelde opvragen door achtereenvolgens aan te klikken: Analyze, Descriptive
statisctics, Frequencies, variabele(n) overbrengen naar rechterkolom, aankruisen of je
wel of niet een frequentietabel wil opvragen, klik op Statistics, duid aan welke parameters
je wil berekenen (vb.mean=rekenkundig gemiddelde), Continue en OK.
Bij het opvragen van een frequentietabel en de modus voor de variabele geslacht uit een
kleine steekproef verkregen we in het output-venster van SPSS het volgende resultaat:

Hieruit kan je afleiden dat er 50 mensen in onze steekproef zitten waarvan 44% mannen
en 56% vrouwen zijn.
In je thesis rapporteer je de beschrijving van je persoonsvariabelen in 1 grote tabel
als volgt. Vergeet niet je tabel een titel te geven.
| Geslacht | 44% mannen |
|---|---|
| 56% vrouwen | |
| Burgerlijke staat | 10% ongehuwd (en single) |
| 25% samenwonend | |
| 37,5% gehuwd | |
| 12,5% gescheiden | |
| 15% weduwe/weduwenaar | |
| Hoogst behaalde diploma | 15% lager secundair |
| 35% hoger secundair | |
| 15% hoger onderwijs, korte type | |
| 20% hoger onderwijs, lange type | |
| 15% universitair |
Nadat je een beschrijving hebt gegeven van je steekproef a.d.h.v. de persoonskenmerken
onderzoek je of je steekproef representatief is voor je populatie. Dit doe je d.m.v. de
"X2 -goodness-of-fit-toets".
Met de X2 -goodness-of-fit-toets kunnen we nagaan of een waargenomen
frequentieverdeling al of niet significant verschilt van een andere frequentieverdeling.
Deze andere theoretische frequentieverdeling kan bijvoorbeeld de verdeling zijn in een
vorig of vergelijkbaar steekproefonderzoek zijn. We kunnen echter ook de verdeling in de
populatie nemen.
Hoe je een X2 -goodness-of-fit-toets moet berekenen wordt goed uitgelegd in de lesnota's van docente Leen Lagasse (bij het vak marktonderzoek).
De analyse van je resultaten zijn afhankelijk van welke onderzoeksvraag je je stelde. Je hypothese zal immers bepalen wat je wil onderzoeken én dus welke statistische toetsen je moet hanteren. In het volgende deel willen we je een leiddraad geven voor de vier voornaamste soorten verbanden tussen variabelen die de HABE-studenten de afgelopen jaren hebben onderzocht. Zoek uit de volgende opsomming welk type van verband jij in je thesis wil onderzoeken. Staat het type van verband dat je onderzocht in je thesis niet in de lijst dan neem je best contact op met je docent voor verdere uitleg.
Bijvoorbeeld: je doet een onderzoek naar de merkpreferentie voor wasprodukten en je
wil nagaan of er een verschil is in merkpreferentie bij de respondenten die de reclamecampagne
op TV voor het merk Cleany zagen en de respondenten die de reclameboodschap niet kregen.
Je afhankelijke variabele is merkpreferentie, je onafhankelijke variabele is het wel of niet
zien van de reclameboodschap. Variabelen die je onderzoek kunnen beïnvloeden, ook
wel covariaten genoemd, zijn geslacht, leeftijd, burgerlijke staat, opleidingsniveau en
netto-inkomen.
Om na te gaan of je steekproef met 44% mannen en 56 % vrouwen representatief is voor
je populatie bereken je dit als volgt in SPSS:
Bij dit onderzoek wil je nagaan of er een verband is tussen twee variabelen.
Voorbeeld: je onderzoekt of er een verband is tussen de prijs van een auto en de
verkoopcijfers van een garagehouder. Je ondervraagt 312 garagehouders naar hun aan -en verkoopcijfers.
De variabele prijs van een auto werd gemeten op ordinaal niveau in drie categorieën:
goedkope prijs ten opzichte van concurrentie, gemiddelde prijs en duur t.o.v. concurrentie.
Ook de variabele verkoopcijfers werd gemeten op ordinaal niveau en onderverdeeld in vijf
categorieën ten opzichte van de concurrentie: slechte verkoopcijfers, matige verkoopcijfers,
goede verkoopcijfers, zeer goede verkoopcijfers, uitstekende verkoopcijfers.
De berekeningen in SPSS voer je uit door achtereenvolgens te klikken: Analyze, Correlate, Bivariate, variabelen overbrengen naar rechterkolom, statistische correlatiecoëfficiënt van Pearson aanduiden en op OK drukken. Je krijgt dan volgend venster te zien:

Bij het drukken op de OK-knop maakt SPSS de berekeningen en krijgen we in het output-venster het volgende resultaat te zien:

Om de Pearson correlatiecoëfficiënt te interpreteren moet je kijken naar
de waarde van je coëfficiënt. Als je een variabele correleert met zichzelf dan kom je
uiteraard een correlatiecoëfficiënt van 1,00 uit. Je moet dus kijken naar de waarde
van je coëfficiënt waarbij je variabele X correleert met variabele Y.
Het significantieniveau van je waarde wordt aangeduid met sterretjes.
Voor de correlatiecoëfficiënt van Pearson staat er een waarde van -0,331. Hieruit kunnen we dus besluiten dat we een significante correlatie vinden van -0,0331 tussen de variabelen ’verkoopcijfers’ en ’prijs tegenover de concurrentie’. We kunnen dus met 99% zekerheid stellen dat de variabele ’prijs tegenover de concurrentie’ en ’verkoopcijfers’ negatief met elkaar correleren. Dit betekent dat een stijging van mijn vraagprijs voor een auto een lichte daling van de verkoopresultaten tot gevolg heeft. M.a.w. mijn omzet zal dalen als ik mijn vraagprijs voor een auto lager zet dan die van mijn concurrenten!
Als je een significante correlatie vind in je onderzoek is het steeds interessant om te onderzoeken of er nog variabelen zijn die invloed hebben op deze samenhang. Het is immers mogelijk dat een hele reeks van variabelen invloed heeft op de behaalde verkoopcijfers. Om dit te onderzoeken test je de hypothese: is er een significante samenhang tussen meerdere variabelen (zie 4.3).
Voor het onderzoeken van een samenhang tussen meerdere variabelen gaan we over van de bivariate statistiek naar de multivariate statistiek. Er zullen dus meerdere variabelen tegelijkertijd bekeken worden op hun onderling verband.
Ons te onderzoeken hypothese is in dit voorbeeld: het belang dat consumenten leggen in
een groter aanbod van auto's en van opties dat een filiaal kan aanbieden en het belang
dat de consumenten leggen in de vraagprijs van een auto t.o.v. de concurrentie,
zullen een invloed hebben op de naambekendheid van het filiaal en de behaalde verkoopcijfers
van dit filiaal.
We veronderstellen dus dat de verkoopcijfers en de naambekendheid van een filiaal groeien
naarmate het assortiment aangeboden opties groter is, naarmate het aanbod auto's groter is
en naarmate het filiaal lagere prijzen aanbiedt dan de concurrentie.
Om deze hypothese te testen vragen we in SPSS een multivariate lineaire regressie op : Analyze, General Linear Model, Multivariate ..., we plaatsen de variabelen over (minstens twee afhankelijke variabelen en één factor aanduiden), en drukken op OK. Standaard staat er in SPSS ingesteld dat we hiermee een ’Full Factorial Model’ opvragen.

SPSS heeft eventjes nodig om je resultaat te berekenen en brengt vervolgens ondermeer de volgende tabel op je scherm:
Er zijn verschillend multivariate statistische toetsen waar je naar kan kijken. We zullen
afspreken dat wij enkel de Wilk's Lambda bekijken. In je tabel zie je bij de rij INTERCEPT staan
dat we een sigficante multivariate toets hebben op het 0,001% niveau. Dit betekent dat we
met 99,9% zekerheid kunnen stellen dat er een wederzijdse beÏnvloeding is van deze drie
factoren op de twee afhankelijke variabelen.
Is je Wilk's Lambda niet significant dan stopt je analyse en besluit je je hypothese met te stellen
dat er geen wederzijdse beïnvloeding is van de variabelen op elkaar.
Indien de Wilk's Lambda echter wel significant is dan kijken we verder naar de tabel
die SPSS nadien weergeeft:

In deze tabel staan de afzonderlijke correlaties en de gezamelijke correlaties op onze twee
afhankelijke variabelen nl. naambekendheid van mijn filiaal en behaalde verkoopcijfers.
Uit deze tabel kan je onder meer de volgende vaststellingen doen:
Bij het bestuderen van de vorige tabel en de vaststellingen kunnen we de volgende twee conclusies formuleren:
Als je een dergerlijk resultaat in je onderzoek vindt is het uiteraard van belang de
onderliggende oorzaken voor deze waarneming te vinden.
Het is immers niet logisch dat het aanbieden van een lagere vraagprijs voor een auto en een
groot aanbod van wagens geen gunstige invloed heeft op je verkoopcijfers. Het zou bijvoorbeeld
kunnen zijn dat consumenten wantrouwig zijn als ze een showroom zien met massa's auto's aan zeer
lage prijzen.
Bij de bespreking van je onderzoeksresultaten moet je minstens enkele mogelijke verklaringen
geven voor je resultaat. Wie jou onderzoek dan leest, kan op basis van jou resultaten nieuwe
onderzoekshypothese stellen en jouw onderzoek hierdoor verder zetten.
Voorbeeld: is er een significant verschil in merkpreferentie voor wasprodukten tussen de groep die de reclameboodschap voor het wasprodukt Cleany wel ontving en de groep die deze reclameboodschap niet zag?
Indien je 2 of meerdere groepen bestudeerd dan moet je eerst nagaan
of er significante verschillen zijn tussen deze groepen op vlak van
de persoonskenmerken (vb. zijn er in groep A significant meer mannen dan vrouwen in
vergelijking met groep B?)
Nadien test je je hypothese door een Anova (F-toets) analyse uit te voeren.
Wanneer je voor je onderzoek 2 of meerdere groepen wil bestuderen op hun onderlinge verschillen en gelijkenissen, is het belangrijk na te gaan of je groepen reeds qua samenstelling verschillend zijn. Men gaat er immers van uit dat je groepen onderling niet mogen verschillen op vlak van de beschrijvende variabelen. Indien je groepen wel van elkaar verschillen dan heb je een probleem. Als je in een latere fase van je onderzoek bemerkt dat je groepen onderling verschillen op een bestudeerd kenmerk (bvb. preferentie voor een bepaald merk van waspoeder) dan weet je niet of dit verschil te verklaren is door de verschillende samenstelling van je groepen of door een verschillende meetwaarde op je bestudeerd kenmerk.
Voorbeeld: stel je doet een onderzoek naar de invloed van een reclamecampagne voor het wasproduct
Cleany. Je hebt twee groepen die je zal bestuderen: de eerste groep heeft de reclamecampagne op TV
niet gezien en de tweede groep heeft de reclamestunt wel opgemerkt.
De samenstelling van je twee groepen ziet er als volgt uit:
| Geen reclame | Wel reclame | |
|---|---|---|
| Geslacht | 30% mannen | 14% mannen |
| 14% vrouwen | 42% vrouwen | |
| Hoogst behaalde diploma | 2% lager secundair | 14% lager secundair |
| 6% hoger secundair | 30% hoger secundair | |
| 8% hoger onderwijs, korte type | 8% hoger onderwijs, korte type | |
| 14% hoger onderwijs, lange type | 4% hoger onderwijs, lange type | |
| 14% universitair | 0% universitair | |
| Burgerlijke staat | 8,2% ongehuwd (en single) | 2% ongehuwd (en single) |
| 10,2% samenwonend | 12,2% samenwonend | |
| 22,4% gehuwd | 18,4% gehuwd | |
| 4,1% gescheiden | 8,2% gescheiden | |
| 0% weduwe/weduwenaar | 14,3% weduwe/weduwenaar |
Stel je voert enkele analyses uit en je gaat na of je twee groepen een verschillende voorkeur hebben voor het merk van waspoeder. Indien je uitkomst is dat er een significant verschil is tussen beide groepen, dan weet je niet of dit verschil er komt doordat de ene groep de reclameboodschap wel heeft gezien en er dus door beïnlvoed wordt of dat je verschillend resultaat te verklaren is doordat er in je eerste groep opmerkelijk meer mannen zitten en in je tweede groep opmerkelijk meer vrouwen met een lagere opleiding. Het onderscheid kan je immers niet meer maken: werd onze groep nu beïnlvoed door de reclamecampagne of staan huisvrouwen vaker in voor de aankoop van wasproducten en zullen zij daardoor ook een grotere bereidheid hebben om voor een ander merk te kiezen?
Reeds met het blote oog kan je zien dat deze 2 groepen van elkaar verschillen op de persoonskenmerken. Toch is het belangrijk om na te gaan of deze verschillen tussen de groepen significant zijn. Immers je samenstelling van de groepen zal nooit voor 100% gelijk zijn. Met de Chi-kwadraat toets wordt bepaald of je groepen significant van elkaar verschillen: deze toets geeft dus aan vanaf welk moment de verschillen tussen je groepen zo groot worden dat ze je volgende statistische analyses kan/zal vertekenen. Omdat de Chi-kwadraat-toets geen zuivere maat is om de associatie tussen 2 variabelen te meten (deze toets wordt o.m. sterk beïnvloed wordt door de grote van je steekproef), wordt er gebruik gemaakt van een gecorrigeerde toets namelijk Cramers' V (hoe groter n, hoe minder nauwkeurig Chi2 is.
In SPSS kan je deze associatiemaat berekenen door achtereenvolgens de volgende menu's te doorlopen:
Analyze, Descriptive statisctics, Crosstabs, variabelen overbrengen naar rechterkant (variabele
die je steekproef in 2 of meerdere groepen verdeelt bij de kolommen), Statistics aanklikken, een
nieuw pop-up window verschijnt waarin je de statistische toets kan aanduiden die je wil berekenen,
kruis Phi/Cramers' V aan, klik op Continue en op OK.
Als we in ons voorbeeld willen nagaan of de verschillende samenstelling tussen de 2 groepen voor de beschrijvende variabele 'burgerlijke staat' significant is, dan berekenen we Cramers'V op de volgende wijze: achtereenvolgens klikken we in SPSS op Analyze, Descriptive Statistics en Crosstabs. Nu verschijnt het dialoogkader voor het berekenen van kruistabellen:

Je brengt de variabelen over naar de rechterkant. Bij het klikken op statistics verschijnt het pop-up window waarin je kan aanduiden welke statistische bivariate toets je wil berekenen.

Indien je nu op Continue drukt kom je weer in het dialoogkader van de kruistabellen terecht. Door
op Cells te klikken, verschijnt het pop-up window waarin je kan vragen om de totale percentages te
berekenen (percentages: total). Je krijgt dan een overzicht van de percentuele verhouding tussen
je groepen op de beschrijvende variabelen (zie tabel hierboven).
Na het drukken op OK in het dialoogkader van de kruistabellen wordt de bivariate toets berekend.
SPSS opent je output-venster waarin je je resultaat kan bekijken. In ons voorbeeld bekwamen we
het volgende resultaat:

Om deze associatiemaat te interpreteren moet je kijken naar de kolom waarin je significantieniveau
staat. Het significantieniveau zegt je met hoeveel zekerheid je je gegevens uit je steekproef
mag veralgemenen naar je populatie.
significantie > 0,05 : de 2 variabelen zijn statistisch onafhankelijk van elkaar ; we mogen dus
veronderstellen dat onze groepen gelijk zijn
significantie
0,05 en > 0,01 :
met 95% zekerheid kunnen we stellen dat onze 2 variabelen niet statistisch onafhankelijk zijn
van elkaar ; we zijn dus voor 95% zeker dat in de populatie onze groepen significant van elkaar
verschillen in samenstelling waardoor we niet zeker zijn of een verschillend meetresultaat een
gevolg is van de verschillende samenstelling of een andere invloed
significantie
0,01 en > 0,001 :
met 99% zekerheid kunnen we stellen dat onze 2 variabelen in de populatie significant van elkaar verschillen;
hierdoor zal de samenstelling van onze groepen ook significant van elkaar verschillen
significantie
0,001:
voor 99,9% zijn we zeker dat onze 2 variabelen statistisch afhankelijk van elkaar zijn
Wat betekent dit resultaat nu in ons voorbeeld?
Voor Cramers' V staat er significantieniveau van 0,091 (waarde Cramer's V is 0,40).
We kunnen pas spreken van een significant verschil tussen de twee groepen als het
significantieniveau kleiner of gelijk is aan 0,05. Hier is het resultaat groter dan 0,05.
We kunnen dus besluiten dat onze twee groepen qua samenstelling
voor de variabele burgerlijke staat niet van elkaar verschillen.

Voor de variabele geslacht bekomen we (zie tabel hierboven) een Cramers' V van 0,432. Deze toets heeft een significantie van 0,002: we kunnen dus met 99% zekerheid stellen dat onze groepen in de populatie wezenlijk van elkaar verschillen op de variabele geslacht.

Voor de variabele hoogst behaald diploma behalen we een Cramers'V van 0,661 (zie tabel hierboven). Dit houdt in dat we met 99,9% zekerheid kunnen stellen (significantie-niveau is kleiner dan 0,001) dat onze twee groepen wezenlijk van elkaar verschillen op het kenmerk "hoogst behaald diploma". Mensen met een lager diploma zullen vaker de reclameboodschap hebben gezien dan mensen met een hoger diploma. Dit is ook niet zo verwonderlijk. Mensen met een lager diploma zijn vaker bejaarden, huisvrouwen en/of werklozen die meer tijd hebben om de reclamecampagne op TV te zien.
Wat voor consequenties heeft dit significant verschil tussen onze twee
groepen nu op de resultaten van onze analyses?
Stel dat we een significant verschil vinden tussen de twee groepen op vlak van de bereidheid om
het wasproduct aan te kopen. Is deze bereidheid bij de groep die de reclamecampagne zag groter doordat
ze beïnlvoed werden door de reclameboodschap? Of is deze bereidheid groter omdat we in deze
groep meer huisvrouwen treffen die instaan voor de was en strijk van hun gezin?
Met ander woorden: de consequentie is dat het niet meer zinvol is je hypothese verder te
onderzoeken als er reeds van bij de aanvang een significant verschil is tussen de groepen die
je bestudeerd.
Indien je een verschillende samenstelling vaststelt heb je twee mogelijkheden: je analyse
stopzetten en concluderen dat verder onderzoek geen zin meer heeft of je analyse toch
uitvoeren maar met herhaaldelijke waarschuwingen dat een verschillend resultaat het gevolg
kan zijn van een verschil in de samenstelling van beide groepen bij aanvang. Wanneer moet
je nu kiezen voor welke situatie: ga hiervoor ten rade bij je docent.
Bij je uitleg over je methode (hoe is je vragenlijst afgenomen, hoe is je survey geconstrueerd)
heb je een overzicht gegeven voor al je respondenten (vb. percentage mannen en vrouwen in je
steekproef).
Voor je onderzoek wil je nagaan of er significante verschillen zijn tussen je groepen op een
bepaald bestudeerd kenmerk. Vooraleer je aan de rapportage van je analyse kan beginnen, moet je
in je resultaatgedeelte een overzicht geven van de beschrijvende variabelen.
Voor ons voorbeeld ziet de rapportage er als volgt uit:
In de eerste plaats is het noodzakelijk om te kijken of de groep die de reclameboodschap wel zag
op TV wezenlijk significant verschilt van de groep die de reclameboodschap niet zag op het
gebied van de persoonskenmerken.
De Cramer's V-toets vergelijkt de frequentieverdeling van de steekproef met de verwachte
celverdeling en gaat na of het verschil significant is. In tabel 1 worden de frequenties en de
significante verschillen vermeld voor de beschrijvende variabelen van de studie.
Er is in onze studie geen significant verschil tussen de groep die de reclameboodschap wel zag
met de groep die deze reclameboodschap niet kreeg op de variabele burgerlijke staat.
Er is wel een significant verschil tussen beide groepen op het 0,05% niveau in het diploma dat
ze bezitten. Er zijn opmerkelijk meer hoger geschoolden in de groep personen die de
reclamecampagne niet gezien heeft. Bovendien vinden we ook een significant verschil in het
geslacht op het 0,05% niveau. In de groep die de reclameboodschap wel zag, zijn er opmerkelijk
meer vrouwen.
In tabel ziet er dit als volgt uit: je procentuele verhoudingen vermeld je en daarnaast zet je een kolom met de waarden van je Cramer's V-toets. De significantie van je toets duid je aan met sterretjes en de verklaring hiervan staat onderaan je tabel.
| Geen reclame | Wel reclame | Cramer's V | |
|---|---|---|---|
| Geslacht | 30% mannen | 14% mannen | 0,432** |
| 14% vrouwen | 42% vrouwen | ||
| Hoogst behaalde diploma | 2% lager secundair | 14% lager secundair | 0,661*** |
| 6% hoger secundair | 30% hoger secundair | ||
| 8% hoger onderwijs, korte type | 8% hoger onderwijs, korte type | ||
| 14% hoger onderwijs, lange type | 4% hoger onderwijs, lange type | ||
| 14% universitair | 0% universitair | ||
| Burgerlijke staat | 8,2% ongehuwd (en single) | 2% ongehuwd (en single) | 0,40 |
| 10,2% samenwonend | 12,2% samenwonend | ||
| 22,4% gehuwd | 18,4% gehuwd | ||
| 4,1% gescheiden | 8,2% gescheiden | ||
| 0% weduwe/weduwenaar | 14,3% weduwe/weduwenaar |
Indien je met de Cramer's V-toets tot de vaststelling kwam dat je groepen niet van
elkaar verschilden op vlak van de persoonskenmerken dan kan je beginnen met de eigenlijke
analyse van je hypothese. Met de Anova-toets kan je nagaan of je groepen significant
van elkaar verschillen op een bestudeerd kenmerk.
We gaan er bij het gebruik van de Anova-toets uit van de veronderstelling dat je afhankelijke
variabele van interval niveau is.
Variantie-analyse vergelijkt net zoals de t-toets gemiddelden van verschillende groepen met elkaar.
Eén van de belangrijkste verschillen met de t-toets is dat bij een t-toets slechts
2 groepen worden onderscheiden, terwijl variantie-analyse doorgaans drie of meerdere groepen
tegerlijkertijd vergelijkt.
Variantie-analyse wordt gebruikt om vast te stellen of de gemiddelden van een aantal groepen
aan elkaar gelijk zijn. Wordt ook wel de F-toets genoemd!
De voorwaarden om een variantie-analyse te mogen uitvoeren:
Opmerking: is je afhankelijke variabele van ordinaal meetniveau dan gebruik je de Cramer's V test van hierboven.
Als voorbeeld nemen we het onderzoek naar de invloed van een reclamecampagne voor
het wasproduct Cleany. Laten we veronderstellen dat we bij het uitvoeren van de Cramer's V
test in vorige punt geen significante verschillen ontdekten in de samenstelling tussen
beide groepen op vlak van de beschrijvende variabelen.
Met behulp van de Anova-toets zullen we trachten te meten wat het effect is van de reclame-
boodschap op het koopgedrag in beide groepen.
In SPSS voer je een Anova-toets uit door de volgende menu-opdracht te geven:
Analyze, Compare Means, One-Way-Anova, breng variabelen over naar rechterkolom, OK.
(Een andere mogelijkheid is : Analyze, General Linear Model, Univariate).
In het output-venster krijg je dan volgend resultaat:

Bij het lezen van de tabel zien we dat de F-toets 57,354 en dit resultaat is significant op het 0,001% niveau. M.a.w. we kunnen concluderen dat onze reclameboodschap een positieve invloed heeft gehad op het koopgedrag van de onderzochte subjecten!
Wil je deze oefening zelf eens maken? Als SPSS geïnstalleerd is op je pc dan kan je de volgende data-file in SPSS downloaden. In je output venster zou je dan dit resultaat moeten krijgen.
In je onderzoek vermeld je een dergelijk resultaat als volgt: Er werd een variantie-analyse uitgevoerd die een F-toets opleverde van 57,354. We kunnen dus concluderen dat er een significant verschil is tussen de groep die de reclame boodschap niet zag met de groep die de reclame boodschap wel waarnam in het koopgedrag en dit op het 0,001% niveau.
Ook deze rubriek is nog in opbouw. Wens je toch dringend informatie hierover. Docente Leen Lagasse kent deze materie goed en je kan steeds advies inwinnen bij haar hieromtrent.
Het meten van de betrouwbaarheid van je meetschaal en het analyseren van de items in je meetschaal is van belang voor het construeren van een betrouwbare vragenlijst.
Zeker bij meervoudige meetschalen is het belangrijk om de interne betrouwbaarheid te bepalen. Deze
meetschalen zijn schalen waarbij de verschillende items/vragen hetzelfde kenmerken bevragen.
Ze zijn immers geconstrueerd uit de som van de individuele items/vragen van een vragenlijst.
Het meten van de betrouwbaarheid van een schaal is gebaseerd op de correlaties tussen de
verschillende items en de varianties tussen deze items. Hierbij gaan we na of de items allen
hetzelfde construct meten of zijn er ook overlappingen met een ander construct.
Wat zou er gebeuren als we in onze meetschaal enkele items opnemen die het kenmerk niet
betrouwbaar meten of die negatief geformuleerd zijn? Onze resultaten zouden vertekend
worden: dit kan een overschatting, onderschatting of neutralisering van je gegevens inhouden.
Daarom is het van belang de interne consistentie van je vragenlijst na te gaan. Zo kan je
eventuele items omkeren (bij een negatieve formulering) of alle onzuivere, onbetrouwbare
items uit je analyses weren.
De Cronbach's coëfficiënt meet de interne betrouwbaarheid van een subschaal.
Om je meetschaal te kunnen gebruiken in je analyses vereisen we minstens een interne betrouwbaarheid
van 0,60. Een interne betrouwbaarheid van 0,80 is goed, 0,90 is zeer goed, 0,95 is uitmuntend.
Hoe meer items je meetschaal (subschaal) bevat, hoe groter de betrouwbaarheid zal zijn van
je meting.
Idealiter bestaat je schaal uit minstens 5 items of vragen. Indien je een
samengestelde meetschaal construeert van minder dan 3 items kan je niet meer spreken
over een subschaal!
Voorbeeld: de opleidingscommissie moet de verschillende studierichting en scholen kritisch evalueren. Men laat de studenten voor een specifiek vak een enquête invullen. In deze vragenlijst peilt men onder meer naar de kennis over het cursusmateriaal (welke hoofdstukken hebben de studenten wel en niet begrepen) en men vindt er ook de volgende negen vragen in terug.
| zeer slecht | slecht | OK | goed | zeer goed | |
|---|---|---|---|---|---|
| 1. Wat vond je van de kennis van de docent over zijn vakinhoud? | 1 | 2 | 2 | 4 | 5 |
| 2. Wat vond je van de voorbereiding van de lesgever voor zijn vak? | 1 | 2 | 3 | 4 | 5 |
| 3. Heeft de lesgever je voldoende gemotiveerd om deel te nemen aan de lessen? | 1 | 2 | 3 | 4 | 5 |
| 4. Had de lesgever voldoende aandacht voor individuele moeilijkheden bij de vakinhoud? | 1 | 2 | 3 | 4 | 5 |
| 5. Hoe ervaarde je het werken in kleine groepen voor het maken van een taak? | 1 | 2 | 3 | 4 | 5 |
| 6. Wat is uw totaal beeld van de lessen? | 1 | 2 | 3 | 4 | 5 |
| 7. Was het duidelijk welke huistaken je moest maken? | 1 | 2 | 3 | 4 | 5 |
| 8. Voldeed de cursus aan je verwachtingen? | 1 | 2 | 3 | 4 | 5 |
| 9. Wat is je appreciatie van het vak? | 1 | 2 | 3 | 4 | 5 |
De subschaal meet de totale appreciatie die de studenten hebben over een bepaald vak: zowel over de lessen, over het huiswerk als over de inhoud.
In SPSS kunnen we de interne betrouwbaarheid van deze meetschaal testen door te klikken: Analyze, Scale, Reliability Analysis, breng de variabelen over (in ons voorbeeld 9), klik op de knop statistics en duid in dit nieuwe venster aan dat je ook de alpha wil kennen als het item uit de subschaal zou worden geweerd, klik op Continue en op OK.


Na het opvragen van de Cronbach Alpha geeft SPSS ondermeer het volgende weer in het output-venster:

Hieruit kan je afleiden dat je Cronbach Alpha gelijk is aan 0,7010 (dus 0,70).
Als je de kolom 'Alpha if item deleted' bekijkt, zie je dat de Cronbach Alpha niet noemenswaardig
stijgt als je een item uit de vragenlijst weert. M.a.w. elk item in de vragenlijst komt goed
overeen met de andere items. Dit betekent dat:
Wanneer je een betrouwbaarheid bekomt van 0,80 of meer dan heb je een goede meetschaal geconstrueerd. Een betrouwbaarheid van 0,60 is minimum vereist. Bekom je een betrouwbaarheid die kleiner is dan 0,60 dan moet je items uit je meetschaal verwijderen zodat je de interne betrouwbaarheid van je meetschaal kan verhogen. Kan je dit niet dan is je meetschaal niet bruikbaar in verdere verwerkingen.