Hoe om uitskieters te bereken
In statistiek, a Atipiese waarde is `n data wat aansienlik verskil van die ander data in die steekproef. Dikwels uitskieters in `n datastel kan statistieke oor eksperimentele afwykings of foute in metings geneem waarsku, en as gevolg van hierdie kan die weggooi datastel. As die uitskieters van die stel
word geïgnoreer, daar kan belangrike veranderinge in die gevolgtrekkings van die studie wees. Daarom is dit belangrik om te weet hoe om uitskieters te bereken en te evalueer, om die korrekte begrip van statistiese data te verseker.stappe
1
Leer hoe om moontlike uitskieters te herken. Voordat u besluit of u die uitskieters van `n sekere datastel moet ignoreer, moet ons eers die moontlike uitskakelaars van die datastel identifiseer. Breedweg is uitskieters data wat baie verskil van die neiging wat uitgedruk word deur die ander waardes in die datastel. Met ander woorde, dit hulle vind ver weg na die ander waardes. Dit is gewoonlik maklik om dit op te spoor in die data tabelle of (veral) in die grafieke. As die datastel visueel in `n grafiek uitgedruk word, is die uitskieters "ver" van die ander waardes. As byvoorbeeld die meeste data in `n datastel `n reguitlyn gevorm het, kon dit nie redelikerwys verklaar word dat die uitskieters deel van daardie lyn was nie.
- Ons gaan `n datastel neem wat die temperature van 12 verskillende voorwerpe in `n kamer voorstel. As 11 voorwerpe het temperature naby aan 70 grade Celsius (21 grade Celsius), maar die twaalfde voorwerp, `n oond met `n temperatuur van 300 grade Celsius (150 grade Celsius), sal `n vinnige punt aan te dui dat die oond is waarskynlik `n atipiese waarde.
2
Sorteer die data van die minste na die grootste. Die eerste stap in die berekening van die uitskieters in `n datastel is om die mediaan (middel) waarde van die datastel te vind. Hierdie taak word baie vereenvoudig as die datastelwaardes in orde is van die minste na die grootste. Dus, voordat u voortgaan, bestel die waardes van die datastel op hierdie manier.
3
Bereken die mediaan van die datastel. Die mediaan van die datastel is die data hierbo, wat die helfte van die data is en onder watter is die ander helfte van die data-basies is die waarde "in die middel" datastel. As die datastel `n vreemde getal data bevat, is dit maklik om dit te vind (die mediaan sal die data wees met dieselfde aantal waardes bo en onder dit). As daar egter `n ewe aantal data is, dan is daar geen enkel middelpunt nie, die middelpunte moet gemiddeld wees om die mediaan te vind. Let daarop dat by die berekening van uitskieters, gewoonlik aan die veranderlike Q2 mediaan omdat leuens tussen Q1 en Q3, die eerste en derde kwartiele, wat later definieer.
4
Bereken die eerste kwartiel. Hierdie waarde, waarmee ons die veranderlike Q1 toeken, is die onderstaande data, wat 25 persent (of kwart) van die waardes is. Met ander woorde, dit is die data wat in die middel van die data in die datastel is onder die mediaan. As daar `n ewe aantal waardes onder die mediaan is, moet jy die twee waardes in die middel weer gemiddeld bereken om Q1 te vind, aangesien jy dalk moet doen om die mediaan self te vind.
5
Bereken die derde kwartiel. Hierdie waarde, waarmee ons die veranderlike Q3 toeken, is die data waarop 25 persent van die waardes geleë is. Die metode om Q3 te vind, is byna identies aan die een wat gebruik is om Q1 te vind, met die verskil dat die data in hierdie geval oorweeg word oor die mediaan, in plaas van die wat daaronder is.
6
Vind die interkwartielreeks. Noudat ons Q1 en Q3 gedefinieer het, moet ons die afstand tussen hierdie twee veranderlikes bereken. Die afstand vanaf Q1 tot Q3 word bereken deur Q1 van Q3 af te trek. Die waarde wat verkry word vir die interkwartielreeks is die sleutel om die grense vir die nie-atipiese waardes van die datastel te bepaal.
7
Vind die "interne grense" van die datastel. Uitskieters word geïdentifiseer wanneer hulle evalueer of hulle binne `n numeriese limiet is, wat `interne grense` en `eksterne grense` genoem word. `N waarde wat buite die interne grense van die datastel lê, word genoem ligte uitskieter, en een wat buite die uiterste grense is, word genoem uiterste atipiese waarde. Om die interne perke van die datastel te vind, vermenigvuldig die interkwartielafstand eers met 1.5. Voeg dan die resultate by Q3 en gee dit aan Q1. Die twee waardes wat u sal verkry uit die resultaat is die interne grense van die datastel.
8
Vind die "buitenste grense" van die datastel. Dit word op dieselfde manier as die interne perke bereken, behalwe dat die interkwartielreeks vermenigvuldig word met 3 in plaas van 1.5. Dan word die resultaat bygevoeg tot Q3 en afgetrek vanaf Q1 om die boonste en onderste eksterne grense te vind.
9
Gebruik `n kwalitatiewe evaluering om te bepaal of u die uitskieters moet "wegdoen" al dan nie. Met behulp van die beskryf metodologie is dit moontlik om vas te stel of sekere data ligte atipiese waardes, ekstreme uitskieters of enige tipe atipiese waarde is. Maak egter geen fout, identifiseer `n data as `n uitskieter, maar kategoriseer dit as `n kandidaat wat geïgnoreer kan word uit die datastel, maar nie as `n data wat nie dit moet geïgnoreer word. die rede waardeur `n uitskieter van die res van die waardes in die datastel onderskei word, is noodsaaklik om te bepaal of die uitskieter nie geïgnoreer moet word nie. Oor die algemeen kan uitskieters wie se oorsprong toegeskryf word aan `n fout van een of ander aard, soos `n fout in die meting, in die rekord of in die eksperimentele ontwerp, geïgnoreer word. Aan die ander kant, uitskieters wat nie aan `n fout toegeskryf kan word nie en wat nuwe inligting of tendense openbaar wat nie in die algemeen voorspel is nie. hulle word nie geïgnoreer nie
10
Verstaan die belangrikheid van (soms) atypiese waardes. Terwyl sommige uitskieters moet geïgnoreer word vir data-stelle, want hulle is die gevolg van `n fout en / of af te lei onakkurate of misleidende resultate wat hulle `n paar uitskieters moet getel word. As, byvoorbeeld, blyk dit dat `n uitskieter geldig is verkry (dit wil sê, nie as gevolg van `n fout) en / of gee jou `n nuwe begrip van die verskynsel wat jy meet, moet nie uitgesluit word nie. Wetenskaplike eksperimente is veral vatbare situasies by die hantering van uitskieters. As u `n buitestaander per ongeluk ignoreer, kan dit beteken dat inligting wat `n tendens of nuwe ontdekkings aandui, weggooi.
wenke
- As jy uitvinders soek, probeer om hul teenwoordigheid te verduidelik voordat hulle van die datastel verwyder word. Hulle kan foute aandui in die afmetings of abnormaliteite van die verspreiding.
Dinge wat jy nodig het
- sakrekenaar
Deel op sosiale netwerke:
Verwante
- Hoe om `n histogram in Excel te skep
- Hoe om `n grafiek te maak
- Hoe om te lieg met statistieke
- Hoe om die vertrouensinterval te bereken
- Hoe om die p-waarde te bereken
- Hoe om die statistiese omvang te bereken
- Hoe om die interkwartielreeks te bereken
- Hoe om die gemiddelde, die standaardafwyking en die standaardfout te bereken
- Hoe om die opgehoopte frekwensie te bereken
- Hoe om statistiese betekenisvolheid te evalueer
- Hoe om `n boksdiagram te maak
- Hoe om `n lyngrafiek te maak
- Hoe om `n wetenskaplike eksperiment uit te voer
- Hoe om die standaardfout te bereken
- Hoe om die standaardafwyking te bereken
- Hoe om die gemiddelde afwyking bo die gemiddelde te bereken (vir nie-geklusterde data)
- Hoe om die standaardafwyking in Excel te bereken
- Hoe om Z tellings te bereken
- Hoe om die omvang van `n datareeks te vind
- Hoe om Minitab te gebruik
- Hoe om `n sekondêre Y-as in `n Excel-kaart by te voeg