Keskmise (keskmise) arvutamiseks liidetakse kõik andmestiku väärtused ja jagatakse seejärel summa väärtuste koguarvuga. See esindab andmete keskset tendentsi.
Valem: Keskmine = (Σx) / n
kus:
- Keskmine on keskmine
- Σx on andmestiku kõigi väärtuste summa
- n on andmestiku väärtuste koguarv
Mediaan on andmestiku keskmine väärtus, kui väärtused on järjestatud kasvavas järjekorras.
Kui väärtusi on paarisarv, on mediaan kahe keskmise väärtuse keskmine.
Valem (paaritu arv väärtusi): Mediaan = keskmine väärtus
Valem (paarisarv väärtusi): Mediaan = (Väärtus positsioonis n/2 + Väärtus positsioonis (n/2 + 1)) / 2
Miinimum on andmestiku väikseim väärtus.
Valem: Miinimum = Väikseim väärtus
Maksimum on andmestiku suurim väärtus.
Valem: Maksimaalne = Suurim väärtus
Vahemik on andmestiku maksimaalse ja minimaalse väärtuse erinevus. See mõõdab andmete levikut või varieeruvust.
Valem: Vahemik = Maksimum - Minimaalne
Keskvahemik on andmestiku maksimaalsete ja minimaalsete väärtuste keskmine.
Valem: keskmine = (maksimaalne + miinimum) / 2
Arv näitab väärtuste koguarvu andmekogumis.
Summa on andmestiku kõigi väärtuste summa.
Valem: summa = Σx
kus:
- Σx on andmestiku kõigi väärtuste summa
Protsentiil tähistab väärtust, millest allapoole teatud protsent andmetest jääb. Seda kasutatakse sageli konkreetsete andmepunktide tuvastamiseks jaotuses.
Kvartiil jagab andmestiku neljaks võrdseks osaks, kusjuures iga osa sisaldab 25% andmetest. Andmete leviku hindamiseks kasutatakse sageli kvartiile.
Ruudude summa on iga andmepunkti ja keskmise erinevuse ruutude summa. See on põhikomponent dispersiooni ja standardhälbe arvutamisel.
Valem: Ruudude summa = Σ(x – keskmine)²
kus:
- Σ tähistab summeerimissümbolit
- x on iga andmepunkt
- Keskmine on andmestiku keskmine (keskmine).
Standardhälve mõõdab variatsiooni või dispersiooni suurust andmekogumis. See näitab, kui hajuvad andmepunktid keskmisest.
Valem: standardhälve = √(Σ(x - keskmine)² / (n - 1))
kus:
- √ tähistab ruutjuurt
- Σ tähistab summeerimissümbolit
- x on iga andmepunkt
- Keskmine on andmestiku keskmine (keskmine).
- n on andmestiku väärtuste koguarv
Dispersioon on andmestiku leviku või hajuvuse mõõt. See on iga andmepunkti ja keskmise vahelise erinevuse ruudus keskmine.
Valem (populatsiooni dispersioon): dispersioon (σ²) = Σ(x – keskmine)² / N
kus:
- Σ tähistab summeerimissümbolit
- x on iga andmepunkt
- Keskmine on andmestiku keskmine (keskmine).
- N on väärtuste koguarv populatsioonis
Märkus. Andmete valimiga töötamisel kasutage valimi dispersiooni valemit, mis jagab N asemel (N - 1). See parandus võtab arvesse valimi kallutatust.
Z-skoor mõõdab, mitu standardhälvet on andmepunktil standardse normaaljaotuse keskmisest. Seda kasutatakse andmete standardimiseks ja nende asukoha hindamiseks keskmise suhtes.
Valem: Z-skoor = (x – keskmine) / standardhälve
kus:
- x on andmepunkt
- Keskmine on andmestiku keskmine (keskmine).
- Standardhälve on andmestiku standardhälve
Kvartiilidevaheline vahemik on andmestiku esimese kvartiili (Q1 – 25. protsentiil) ja kolmanda kvartiili (Q3 – 75. protsentiil) vaheline vahemik. See mõõdab andmete keskmise 50% levikut.
Valem: IQR = Q3 - Q1
kus:
- Q1 on esimene kvartiil (25. protsentiil)
- Q3 on kolmas kvartiil (75. protsentiil)
Variatsioonikoefitsient on suhteline varieeruvuse mõõt ja seda väljendatakse protsentides. Seda kasutatakse andmete standardhälbe võrdlemiseks selle keskmisega, muutes selle kasulikuks erinevate vahenditega andmekogumite suhtelise varieeruvuse hindamiseks.
Valem: CV = (standardhälve / keskmine) * 100%
Skewness mõõdab reaalse väärtusega juhusliku suuruse tõenäosusjaotuse asümmeetriat. See näitab, kas andmed on kallutatud paremale või vasakule.
Positiivne kalduvus näitab, et jaotuse saba on kaldu paremale (paremale viltu), mis tähendab, et jaotuse paremal küljel on äärmuslikumad väärtused.
Negatiivne kalduvus näitab, et jaotuse saba on kaldu vasakule (vasakule kaldu), mis tähendab, et jaotuse vasakul küljel on äärmuslikumad väärtused.
Kurtosis mõõdab reaalväärtusliku juhusliku suuruse tõenäosusjaotuse "sabalisust". See näitab andmetes kõrvalekallete olemasolu ja määra.
Positiivne kurtoos (leptokurtic) tähistab raskeid sabasid ja tippu, mis tähendab, et andmetel on äärmuslikumad väärtused ja need on haripunktilisemad kui normaaljaotus.
Negatiivne kurtoos (platykurtic) näitab heledaid sabasid ja tasasemat jaotust, mis tähendab, et andmetel on vähem äärmuslikke väärtusi ja need on tavalisest jaotumisest lamedad.
Kovariatsioon mõõdab, mil määral kaks muutujat koos muutuvad. See näitab, kas muutujatel on positiivne või negatiivne lineaarne seos.
Valem: Cov(X, Y) = Σ((X - keskmine (X)) * (Y - keskmine (Y))) / (n - 1)
kus:
- Σ tähistab summeerimissümbolit
- X ja Y on muutujad
- Keskmine (X) ja keskmine (Y) on vastavalt X ja Y keskmised
- n on vaatluste koguarv
Kui kovariatsioon on positiivne, näitab see positiivset seost (X kipub suurenema, kui Y suureneb).
Kui kovariatsioon on negatiivne, näitab see negatiivset seost (X kipub Y suurenemisel vähenema).
Korrelatsioonikordaja mõõdab kahe muutuja vahelise lineaarse seose tugevust ja suunda. See on kovariatsiooni normaliseeritud versioon, mis jääb vahemikku -1 kuni 1.
Valem: r = Cov(X, Y) / (standardhälve (X) * standardhälve (Y))
kus:
- Cov(X, Y) on kovariatsioon X ja Y vahel
- Standardhälve (X) ja standardhälve (Y) on vastavalt X ja Y standardhälbed
Kui |r| on 1-le lähedane, näitab see tugevat lineaarset seost, kusjuures positiivne r näitab positiivset ja negatiivne r negatiivset korrelatsiooni. Kui |r| on nullilähedane, näitab see nõrka või puuduvat lineaarset seost.
Viimati värskendatud: 19. jaanuaril 2024
Emma Smithil on Irvine Valley College'is magistrikraad inglise keeles. Ta on olnud ajakirjanik alates 2002. aastast, kirjutades artikleid inglise keele, spordi ja õiguse teemadel. Loe tema kohta minu kohta rohkem bio-leht.