Статистичке формуле

Значити

Средња вредност (просек) се израчунава тако што се саберу све вредности у скупу података, а затим се збир подели укупним бројем вредности. Представља централну тенденцију података.

Формула: Средња вредност = (Σк) / н

Где:

  • Средња вредност је просек
  • Σк је збир свих вредности у скупу података
  • н је укупан број вредности у скупу података
средњи

Медијан је средња вредност у скупу података када су вредности распоређене у растућем редоследу.

Ако постоји паран број вредности, медијана је просек две средње вредности.

Формула (непаран број вредности): медијана = средња вредност

Формула (паран број вредности): медијана = (вредност на позицији н/2 + вредност на позицији (н/2 + 1)) / 2

минимум

Минимум је најмања вредност у скупу података.

Формула: Минимум = Најмања вредност

Максимум

Максимум је највећа вредност у скупу података.

Формула: Максимум = Највећа вредност

Домет

Опсег је разлика између максималне и минималне вредности у скупу података. Обезбеђује меру ширења или варијабилности података.

Формула: Опсег = Максимум - Минимум

Средња фреквенција

Средњи опсег је просек максималне и минималне вредности у скупу података.

Формула: средњи опсег = (максимум + минимум) / 2

Рачунати

Број представља укупан број вредности у скупу података.

Сума

Збир је збир свих вредности у скупу података.

Формула: Збир = Σк

Где:

  • Σк је збир свих вредности у скупу података
Перцентил

Процентил представља вредност испод које пада дати проценат података. Често се користи за идентификацију специфичних тачака података у дистрибуцији.

Квартил

Квартил дели скуп података на четири једнака дела, при чему сваки део садржи 25% података. Квартили се често користе за процену ширења података.

Збир квадрата

Збир квадрата је збир квадрата разлика између сваке тачке података и средње вредности. То је кључна компонента у израчунавању варијансе и стандардне девијације.

Формула: Збир квадрата = Σ(к - Средња)²

Где:

  • Σ представља симбол сумирања
  • к је свака тачка података
  • Средња вредност је средња вредност (просек) скупа података
Стандардна девијација

Стандардна девијација мери количину варијације или дисперзије у скупу података. То показује колико су тачке података распоређене од средње вредности.

Формула: стандардна девијација = √(Σ(к - средња вредност)² / (н - 1))

Где:

  • √ представља квадратни корен
  • Σ представља симбол сумирања
  • к је свака тачка података
  • Средња вредност је средња вредност (просек) скупа података
  • н је укупан број вредности у скупу података
Такође читајте:  Море против Залива: разлика и поређење
варијација

Варијанца је мера ширења или дисперзије скупа података. То је просек квадрата разлика између сваке тачке података и средње вредности.

Формула (варијанса становништва): варијанса (σ²) = Σ(к - средња вредност)² / Н

Где:

  • Σ представља симбол сумирања
  • к је свака тачка података
  • Средња вредност је средња вредност (просек) скупа података
  • Н је укупан број вредности у популацији

Напомена: Када радите са узорком података, користите формулу варијансе узорка, која се дели са (Н - 1) уместо са Н. Ова корекција узима у обзир пристрасност узорка.

З-Сцоре

З-сцоре мери колико је стандардних девијација тачка података од средње вредности у стандардној нормалној дистрибуцији. Користи се за стандардизацију података и процену њиховог положаја у односу на средњу вредност.

Формула: З-Сцоре = (к - Средња) / Стандардна девијација

Где:

  • к је тачка података
  • Средња вредност је средња вредност (просек) скупа података
  • Стандардна девијација је стандардна девијација скупа података
Интерквартилни опсег (ИКР)

Интерквартилни опсег је опсег између првог квартила (К1 - 25. перцентил) и трећег квартила (К3 - 75. перцентил) у скупу података. Обезбеђује меру ширења средњих 50% података.

Формула: ИКР = К3 - К1

Где:

  • К1 је први квартил (25. перцентил)
  • К3 је трећи квартил (75. перцентил)
Коефицијент варијације (ЦВ)

Коефицијент варијације је релативна мера варијабилности и изражава се у процентима. Користи се за упоређивање стандардне девијације података са средњом вредношћу, што га чини корисним за процену релативне варијабилности између скупова података са различитим средњим вредностима.

Формула: ЦВ = (стандардно одступање / средња вредност) * 100%

Скевнесс

Скевнесс мери асиметрију дистрибуције вероватноће случајне променљиве реалне вредности. Означава да ли су подаци искривљени удесно или улево.

Позитивна косина указује на то да је реп дистрибуције искошен удесно (десно нагнуто), што значи да има више екстремних вредности на десној страни дистрибуције.

Негативна косина указује на то да је реп дистрибуције искошен улево (лево закошен), што значи да има више екстремних вредности на левој страни дистрибуције.

Куртосис

Куртозис мери "репност" дистрибуције вероватноће случајне променљиве реалне вредности. Указује на присуство и степен одступања у подацима.

Позитиван куртосис (лептокуртик) указује на тешке репове и врхунац, што значи да подаци имају екстремније вредности и да су више од нормалне дистрибуције.

Такође читајте:  Продавац на велико против велетрговаца: разлика и поређење

Негативни ексцес (платикуртиц) указује на светле репове и равнију дистрибуцију, што значи да подаци имају мање екстремних вредности и да су равнији од нормалне дистрибуције.

Коваријанса

Коваријанса мери степен до којег се две варијабле мењају заједно. Показује да ли варијабле имају позитивну или негативну линеарну везу.

Формула: Цов(Кс, И) = Σ((Кс - Средња (Кс)) * (И - Средња (И))) / (н - 1)

Где:

  • Σ представља симбол сумирања
  • Кс и И су променљиве
  • Средња (Кс) и Средња (И) су средња вредност за Кс и И, респективно
  • н је укупан број посматрања

Ако је коваријанса позитивна, то указује на позитивну везу (Кс има тенденцију повећања када се И повећава).

Ако је коваријанса негативна, то указује на негативан однос (Кс има тенденцију смањења када се И повећава).

Коефицијент корелације (Пеарсонов р)

Коефицијент корелације мери јачину и правац линеарне везе између две варијабле. То је нормализована верзија коваријансе која се креће од -1 до 1.

Формула: р = Цов(Кс, И) / (Стандардна девијација(Кс) * Стандардна девијација(И))

Где:

  • Цов(Кс, И) је коваријанса између Кс и И
  • Стандардна девијација(Кс) и стандардна девијација(И) су стандардне девијације Кс и И, респективно

Ако |р| је близу 1, указује на јаку линеарну везу, при чему позитивно р указује на позитивну корелацију, а негативно р на негативну корелацију. Ако |р| је близу 0, то указује на слаб или никакав линеарни однос.

Последње ажурирање: 19. јануара 2024

тачка 1
Један захтев?

Уложио сам толико труда да напишем овај пост на блогу да бих вам пружио вредност. Биће ми од велике помоћи ако размислите о томе да га поделите на друштвеним мрежама или са својим пријатељима/породицом. ДЕЉЕЊЕ ЈЕ ♥

Желите да сачувате овај чланак за касније? Кликните на срце у доњем десном углу да бисте сачували у свом пољу за чланке!