2 Sigma-beperkingsbeperkingen

Het gebruik van sigma, ook wel standaarddeviatie genoemd, kan verwarrend zijn. Het is echter een geweldig hulpmiddel voor het analyseren van elke set gegevens. Het gebruik van twee-sigma-controlelimieten kan uw analyse ten goede komen door de gegevens die u niet nodig hebt te hakken en alleen de relevante gegevens bij de hand te houden. Het beste van alles, aangezien de theorie achter controlelimieten gebaseerd is op standaarddeviatie, is er heel weinig wiskunde bij betrokken.

Standaardafwijking

Sigma-metingen van welke aard dan ook zijn gebaseerd op de standaarddeviatie van een reeks getallen. Standaardafwijking is een maatstaf voor variabiliteit binnen een reeks cijfers. Een gegevensset met een kleine hoeveelheid verschil tussen de getallen zal een kleine standaardafwijking hebben, terwijl een gegevensverzameling met allerlei verschillende getallen een hogere standaardafwijking zal hebben. De standaardafwijking van een reeks getallen wordt weergegeven door het Griekse personagesigma, waar de termen zoals twee-sigma, drie-sigma en zes-sigma vandaan komen.

Normale verdeling

Het gebruik van standaarddeviatie is grotendeels afhankelijk van een normale verdeling, wat betekent dat de cijfers binnen de dataset relatief gecomprimeerd zijn. De meeste nummers liggen redelijk dicht bij het gemiddelde, met enkele uitschieters die de gegevens scheef trekken. Als de distributie voor een gegevensset niet normaal is, werkt de analyse met standaarddeviatie niet. Als de gegevensset echter wel binnen de normale verdeling valt, kunt u veel leren over de gegevens met behulp van standaarddeviatie.

Twee-Sigma

De normale verdeling toont hoe aantallen zullen dalen op basis van de standaarddeviatie van de gegevensverzameling. De regels voor de normale verdeling bepalen dat 68 procent van alle getallen binnen een standaardafwijking van het gemiddelde valt, ook wel het gemiddelde van alle getallen in de gegevensset genoemd. Het toevoegen van standaardafwijkingen aan de vergelijking betekent dat er meer nummers zijn opgenomen; bij gebruik van de normale verdeling ligt 95 procent van alle gegevens binnen twee standaardafwijkingen van het gemiddelde. Deze 95 procent is een veel voorkomend betrouwbaarheidsinterval dat wordt gebruikt bij het testen van hypothesen, omdat het uitschieters uitsluit en vasthoudt aan de belangrijkste gegevenslevering.

Two-Sigma in het bedrijfsleven

Hoewel two-sigma een goed betrouwbaarheidsniveau geeft voor analyse, is het geen goede methodologie voor productie. Als de controlelimieten van een productieproces binnen twee standaardafwijkingen van het gemiddelde liggen, is dat proces in ernstige problemen. Het zegt in feite dat van een miljoen geproduceerde eenheden meer dan 300.000 defect zijn. Dit is een uiterst inefficiënte manier om goederen te produceren. Produceren met zelfs een drievoudige snelheid zou dat defectniveau terugbrengen naar 66.000; hoewel dit absoluut niet perfect is, is het bijna 500 procent efficiënter dan het produceren op twee sigma's.