Wat is er mis met p-waarden?

 Gepubliceerd door om 20:48  Onderzoek
jan 272015
 

p-waarden
Het plaatje is nog grappig (zeker als je bezig bent met onderzoek), dit bericht zegt het iets duidelijker “p-values Suck“, of iets uitgebreider:

p-values are visual noise taking up precious journal space that could be filled with useful stuff such as actual estimates, effect sizes, scatter plots, confidence or credible intervals, R-code, AICs and DICs, box plots, yes sometimes even white space would be an improvement. I’m not going to rant more about p-values here, they have already been accurately characterized by others (bron)

Deel dit bericht:
jun 282014
 

Het is, zo te lezen, nog een werk in uitvoering, maar Lively R, een uitbreiding op R die op haar beurt weer gebruik maakt van een aantal andere uitbreidingen, ziet er nu al heel interessant uit.

Zoals je in het filmpje hierboven kunt zien, kun je interactief met de data aan de slag. Vooral handig in het eerste analyserende deel van je onderzoek. Maar ook, zoals in het filmpje ook aangegeven wordt, mooi voor studenten die het kunnen gebruiken om meer zicht te krijgen op de achterliggende theorie. Of die zo eenvoudig kunnen *zien* wat het effect is van de breedte van je ‘kolommen’ in een histogram. Of van de richting van je X en Y-as, hoe je regressielijnen kunt passen op je data etc.
Natuurlijk, zonder kennis van de onderliggende theorie, kun je ook hier niets mee. Maar met alleen de theorie snap je het ook niet altijd meteen en dan kun je hier mee aan de slag.

Deel dit bericht:

MOOC’s over Statistiek met R

 Gepubliceerd door om 19:47  Onderwijs, Tip, Tools
dec 062013
 

MOOCs_R Toen ik op 22 september jl. begon aan de MOOC Statistics One, verzorgd door Andrew Conway van de Princeton Universiteit, was R als programma voor mij nog een volledig onbekend iets. D.w.z. ik had er wél van gehoord, ik wist dat er mensen waren die er heel interessante dingen mee voor elkaar kregen, maar voor mij was de omgeving nog een raadsel.

Dat is nu inmiddels wel anders. Naast de dingen die in de de MOOC aan bod komen, had ik op een gegeven moment voldoende basis om op basis van andere online documentatie en instructies meer te doen. Maar de Statistics One course smaakte ook naar meer. Ik was dan ook heel blij met de lijst met populairste Coursera MOOC’s die gebruik maken van R.
De eerste, meest populaire MOOC op het lijstje is “Social Network Analysis“, dat verrast me overigens wel een beetje, want daar staat vooral Gephi centraal. Nummer twee op het lijstje is de Statistics One MOOC van Andrew Conway, die heb ik nu bijna afgerond. Dus ging ik het lijstje verder af…

Computing for Data Analysis start in januari 2014. Er is nog geen toegang tot materiaal, dus daar kan ik nog niet veel mee, ik heb me wel aangemeld. Data Analysis van Jeff Leek is al een tijdje bezig, maar toegang staat nog open (al wordt het moeilijk om nog voldoende credits te halen voor succesvolle afronding, mocht je dat willen). Hier vindt je o.a. een lijst “R Background Lectures (OPTIONAL)” met filmpjes die voor mij deel overbodig zijn (zoals over het installeren van R), maar ook zaken die ik nog niet kende, zoals het genereren van gesimuleerde datasets met specifieke eigenschappen. En ook over het tekenen van grafieken zijn er een aantal video’s te vinden die het allemaal net een detailniveau dieper uitleggen dan de Statistics One trainingen. En daar komen nu ook zaken als voorspellen met boomstructuren of K-means aan bod. Zaken die mij nu nog niets zeggen (moet die filmpjes nog bekijken). Handig dus als aanvulling!
Introduction to Data Science is (nog) niet toegankelijk. Introduction to Computational Finance and Financial Econometrics start pas in februari 2014 en is wellicht niet helemaal mijn terrein. Core Concepts in Data Analysis zou wel weer aan kunnen sluiten, maar start pas in de loop van 2014. Data Analysis and statistical inference, gaat ook pas in 2014 van start en lijkt qua inhoud op Statistics One. Statistics: Making Sense of Data is al afgelopen, maar ook nog toegankelijk als archief. Grappig hier vind ik dat de onderwerpen op zich overlappen met Statistics One, maar de aanpak qua uitleg en dergelijke, ondanks dat ze beiden R gebruiken, toch heel anders is.

Duidelijk is wel dat er wat betreft basis statistiek met R inmiddels een mooi aanbod aan het ontstaan is van gratis MOOCs die qua uitleg/inhoud van de instructies goed in elkaar zitten. Door de verschillen in aanpak zou er ook ruimte moeten zijn voor verschillen in voorkeur bij studenten als het gaat om de manier waarop ze de stof uitgelegd krijgen. Let op, dat is natuurlijk slechts een deel van de uiteindelijk noodzakelijke didactische flexibiliteit die we zullen moeten bereiken!

(getipt door een tweet van Andrew Conway)

Deel dit bericht:

De liefde voor Statistiek

 Gepubliceerd door om 21:19  Onderwijs, Video
dec 162012
 


De kans is groot dat je professor Hans Rosling al kent van zijn TED-video’s. Maar deze video van bijna een uur kende ik in ieder geval nog niet. Hij gaat over de geschiedenis van Statistiek. Wist jij dat de Zweden er mee begonnen zijn? Of dat Florence Nightingale de grondlegster is van het vastleggen van statistieken in grafieken? Dat Hans Rosling daar enthousiast over is, is natuurlijk wel te begrijpen gezien zijn voorliefde voor het gebruik van dynamische grafieken (de ‘bewegende bollen’) bij zijn presentaties over de wereldbevolking.
Mooi is ook het voorbeeld van Google waar statistische relaties tussen woorden gebruikt worden bij het automatisch vertalen van teksten.

Wat mij betreft is de volledige documentaire (ja, ik weet het, bijna 1 heel uur), verplichte stof bij de introductie van het vak statistiek voor leerlingen. Zo jong mogelijk mee beginnen lijkt me, Florence was 9 jaar oud toen ze haar eerste (gedocumenteerde) statistische tabellen maakte.

(Met dank aan Hans Vink voor de tip)

Deel dit bericht: