Statistische ontwikkeling en validatie

Een groot onderdeel van de expertises die door Dittner Holding BV worden aangeboden is statistische ontwikkeling en validatie.

Bij statische ontwikkeling wordt er gekeken naar een oplossing voor een statistisch probleem. Voorbeelden van deze problemen zijn: “Hoe berekenen we het verschil tussen twee statistische variabelen (zoals gemiddelde en kurtosis) en welke verdeling heeft dit verschil?”, “Wat is het gemiddelde en de verdeling van de ratio van twee statistische variabelen die allebei een gemiddelde van 0 hebben? Bijvoorbeeld de ratio van twee normaal verdeelde variabelen zoals N(0,σ1)/N(0,σ2).” Met behulp van mathematische statistiek worden werkbare oplossingen geformuleerd. De uitwerking van deze problemen wordt volledig gedocumenteerd voor toekomstige ontwikkeling of additioneel onderzoek.  Tevens wordt met de documentatie volledige transparantie gewaarborgd.

Bij statische validatie worden methoden die gebruikt zijn in een statistisch onderzoek, model, of als techniek op zichzelf, onderzocht op hun validiteit, i.e. of de methoden terecht en op een correcte manier zijn gebruikt.
Een statistisch onderzoek begint met de beoordeling van de consistentie van de gebruikte data. Hierbij wordt de data beoordeeld op de manier van samenstelling, volledigheid en interne consistentie.
Een veelvoorkomend verschijnsel is dat data waarop een statistisch onderzoek wordt uitgevoerd, ingevoerd worden in statistische software waarbij de software de resultaten berekent in een ‘black box’. Deze ‘black box’ gebruikt een aantal aannames dat voor statistische analyse essentieel is en zeer veel invloed heeft op de uiteindelijke resultaten. In het beste geval worden deze aannames grosso modo als ‘waar’ aangenomen door de onderzoeker, maar vaker is het zo dat de aannames totaal onbekend zijn bij de onderzoeker. Veel statistische onderzoeken zijn alleen op dit punt al als ‘ongeldig’ te beoordelen. Nog vaker gebeurt het dat data onterecht gebruikt zijn in een gekozen statische methode. Deze statistische methoden hangen nauw samen met de gekozen verdeling van de schatter (zoals bijvoorbeeld het gemiddelde, standaarddeviatie, kurtosis, skewness, etc). Het is dan vaak zo dat gekozen wordt voor bijvoorbeeld een verdeling van een schatter die alleen gebruikt mag worden voor een data-set die voldoende groot is. Wanneer deze resultaten vervolgens worden vertaald naar conclusies zorgt een opeenstapeling van verkeerde aannames en verkeerde methodieken voor een conclusie zonder enige geldigheid.

Voorbeelden van bovenstaande expertises zijn de door Dittner Holding BV uitgevoerde opdrachten “EWS γ-01 (DBC)” en “EWS γ-17 (Med)”.