Gegevensprecisie is een van de belangrijkste overwegingen bij het uitvoeren van wetenschappelijke of statistische analyses. Doorgaans verward met het even belangrijke concept van nauwkeurigheid, laat de analogie van het dartbord, die door de Universiteit van Hawaï wordt gearticuleerd, de relatie zien: nauwkeurige datapunten die uitkomen op gelijke verwachte resultaten, terwijl nauwkeurige datapunten dicht bij elkaar clusteren, zelfs als ze niet dichtbij zijn. verwachte resultaten. Volgens Dartmouth College is precisie een maat voor de reproduceerbaarheid van een reeks resultaten. Precisie in datasets is een belangrijk concept, zelfs in technologische aangelegenheden, zoals Kenneth E. Foote en Donald J. Huebner met de Universiteit van Texas-Austin laten zien in een analyse van geografische informatiesystemen. Precisie berekenen is een vrij eenvoudige, maar enigszins subjectieve oefening.
Items die je nodig hebt
-
Grafische weergave van een dataset
-
Informatie over de relevante eenheden uitgedrukt in de gegevens
-
Minimaal toegestane foutenmarge in het experiment
Ontwikkel een visuele weergave van gegevenspunten, zoals een scatterplot. Een zeer eenvoudige visuele weergave omvat het plotten van de corresponderende afhankelijke en onafhankelijke variabelewaarden voor elk gegevenspunt op een Cartesiaans coördinatenstelsel.
Beoordeel de groeperingen van gegevenspunten en zoek naar patronen. Precieze gegevens worden weergegeven in clusters van gegevenspunten, wat aangeeft dat vergelijkbare invoervariabelen correleren met vergelijkbare uitvoervariabelen.
Pas informatie toe over de maateenheden die worden gebruikt om de gegevens te verzamelen om de gemiddelde afstand tussen gegevenspunten te bepalen. Een eenvoudige liniaalmeting kan worden gebruikt om de afstand tussen punten in de grafiek te bepalen en vervolgens om te zetten met behulp van een willekeurige, handige schaal die overeenkomt met de meeteenheden die worden gebruikt om de gegevenspunten te genereren. Hiermee kan de nauwkeurigheid van gegevenspunten ten opzichte van elkaar worden berekend door het gemiddelde van de afstanden te nemen.
Vergelijk de minimale foutmarge die is toegestaan in het experiment en de gemiddelde nauwkeurigheid van de gegevenspunten om de relatieve algehele precisie van het experiment te bepalen. Verschillende soorten experimenten hebben meer of minder fouttolerantie: een engineeringproject vereist waarschijnlijk precisie tot zeer kleine eenheden, terwijl een sociaal experiment waarschijnlijk meer variantie tolereert.
Tips
-
Probeer de waarschijnlijke eenheidsschaal te beoordelen voordat u de grafische weergave van de gegevenspunten maakt. Dit maakt het eenvoudiger om de precisie visueel te beoordelen om gebieden met een opmerkelijke precisie of onnauwkeurigheid te identificeren.
Duidelijke gegevenspatronen die voorkomen op een visuele representatie zijn zeer indicatief voor precisie en de herhaalbaarheid van een experiment. Voortgezet experimenteren zou verdere gegevenspunten moeten toevoegen in precieze clusters in de buurt van de reeds bestaande.
Waarschuwing
Verwar nauwkeurigheid niet met precisie. Als het doel van een experiment het bereiken van een gemiddelde uitvoerwaarde van geven voor alle invoeren is, en dit wordt bereikt door gemiddelde waarden van -12 tot 14, is het onwaarschijnlijk dat dit een precieze meting is, hoewel deze nauwkeurig kan zijn. Een nauwkeurige meting kan ertoe leiden dat alle datapunten rond 17 clusteren, wat onnauwkeurig, maar nauwkeurig en daarom voorspelbaar zou zijn.