Средња вредност (просек) се израчунава тако што се саберу све вредности у скупу података, а затим се збир подели укупним бројем вредности. Представља централну тенденцију података.
Формула: Средња вредност = (Σк) / н
Где:
- Средња вредност је просек
- Σк је збир свих вредности у скупу података
- н је укупан број вредности у скупу података
Медијан је средња вредност у скупу података када су вредности распоређене у растућем редоследу.
Ако постоји паран број вредности, медијана је просек две средње вредности.
Формула (непаран број вредности): медијана = средња вредност
Формула (паран број вредности): медијана = (вредност на позицији н/2 + вредност на позицији (н/2 + 1)) / 2
Минимум је најмања вредност у скупу података.
Формула: Минимум = Најмања вредност
Максимум је највећа вредност у скупу података.
Формула: Максимум = Највећа вредност
Опсег је разлика између максималне и минималне вредности у скупу података. Обезбеђује меру ширења или варијабилности података.
Формула: Опсег = Максимум - Минимум
Средњи опсег је просек максималне и минималне вредности у скупу података.
Формула: средњи опсег = (максимум + минимум) / 2
Број представља укупан број вредности у скупу података.
Збир је збир свих вредности у скупу података.
Формула: Збир = Σк
Где:
- Σк је збир свих вредности у скупу података
Процентил представља вредност испод које пада дати проценат података. Често се користи за идентификацију специфичних тачака података у дистрибуцији.
Квартил дели скуп података на четири једнака дела, при чему сваки део садржи 25% података. Квартили се често користе за процену ширења података.
Збир квадрата је збир квадрата разлика између сваке тачке података и средње вредности. То је кључна компонента у израчунавању варијансе и стандардне девијације.
Формула: Збир квадрата = Σ(к - Средња)²
Где:
- Σ представља симбол сумирања
- к је свака тачка података
- Средња вредност је средња вредност (просек) скупа података
Стандардна девијација мери количину варијације или дисперзије у скупу података. То показује колико су тачке података распоређене од средње вредности.
Формула: стандардна девијација = √(Σ(к - средња вредност)² / (н - 1))
Где:
- √ представља квадратни корен
- Σ представља симбол сумирања
- к је свака тачка података
- Средња вредност је средња вредност (просек) скупа података
- н је укупан број вредности у скупу података
Варијанца је мера ширења или дисперзије скупа података. То је просек квадрата разлика између сваке тачке података и средње вредности.
Формула (варијанса становништва): варијанса (σ²) = Σ(к - средња вредност)² / Н
Где:
- Σ представља симбол сумирања
- к је свака тачка података
- Средња вредност је средња вредност (просек) скупа података
- Н је укупан број вредности у популацији
Напомена: Када радите са узорком података, користите формулу варијансе узорка, која се дели са (Н - 1) уместо са Н. Ова корекција узима у обзир пристрасност узорка.
З-сцоре мери колико је стандардних девијација тачка података од средње вредности у стандардној нормалној дистрибуцији. Користи се за стандардизацију података и процену њиховог положаја у односу на средњу вредност.
Формула: З-Сцоре = (к - Средња) / Стандардна девијација
Где:
- к је тачка података
- Средња вредност је средња вредност (просек) скупа података
- Стандардна девијација је стандардна девијација скупа података
Интерквартилни опсег је опсег између првог квартила (К1 - 25. перцентил) и трећег квартила (К3 - 75. перцентил) у скупу података. Обезбеђује меру ширења средњих 50% података.
Формула: ИКР = К3 - К1
Где:
- К1 је први квартил (25. перцентил)
- К3 је трећи квартил (75. перцентил)
Коефицијент варијације је релативна мера варијабилности и изражава се у процентима. Користи се за упоређивање стандардне девијације података са средњом вредношћу, што га чини корисним за процену релативне варијабилности између скупова података са различитим средњим вредностима.
Формула: ЦВ = (стандардно одступање / средња вредност) * 100%
Скевнесс мери асиметрију дистрибуције вероватноће случајне променљиве реалне вредности. Означава да ли су подаци искривљени удесно или улево.
Позитивна косина указује на то да је реп дистрибуције искошен удесно (десно нагнуто), што значи да има више екстремних вредности на десној страни дистрибуције.
Негативна косина указује на то да је реп дистрибуције искошен улево (лево закошен), што значи да има више екстремних вредности на левој страни дистрибуције.
Куртозис мери "репност" дистрибуције вероватноће случајне променљиве реалне вредности. Указује на присуство и степен одступања у подацима.
Позитиван куртосис (лептокуртик) указује на тешке репове и врхунац, што значи да подаци имају екстремније вредности и да су више од нормалне дистрибуције.
Негативни ексцес (платикуртиц) указује на светле репове и равнију дистрибуцију, што значи да подаци имају мање екстремних вредности и да су равнији од нормалне дистрибуције.
Коваријанса мери степен до којег се две варијабле мењају заједно. Показује да ли варијабле имају позитивну или негативну линеарну везу.
Формула: Цов(Кс, И) = Σ((Кс - Средња (Кс)) * (И - Средња (И))) / (н - 1)
Где:
- Σ представља симбол сумирања
- Кс и И су променљиве
- Средња (Кс) и Средња (И) су средња вредност за Кс и И, респективно
- н је укупан број посматрања
Ако је коваријанса позитивна, то указује на позитивну везу (Кс има тенденцију повећања када се И повећава).
Ако је коваријанса негативна, то указује на негативан однос (Кс има тенденцију смањења када се И повећава).
Коефицијент корелације мери јачину и правац линеарне везе између две варијабле. То је нормализована верзија коваријансе која се креће од -1 до 1.
Формула: р = Цов(Кс, И) / (Стандардна девијација(Кс) * Стандардна девијација(И))
Где:
- Цов(Кс, И) је коваријанса између Кс и И
- Стандардна девијација(Кс) и стандардна девијација(И) су стандардне девијације Кс и И, респективно
Ако |р| је близу 1, указује на јаку линеарну везу, при чему позитивно р указује на позитивну корелацију, а негативно р на негативну корелацију. Ако |р| је близу 0, то указује на слаб или никакав линеарни однос.
Последње ажурирање: 19. јануара 2024
Ема Смит је магистрирала енглески језик на Ирвине Валлеи Цоллеге-у. Новинарка је од 2002. године, пишући чланке о енглеском језику, спорту и праву. Прочитајте више о мени на њој био паге.