Statistikos pasaulyje dažnai girdime terminą „vidurkis“, tačiau ar kada susimąstėte, kad jis ne visada atspindi tikrąją situaciją? Įsivaizduokite situaciją: mažoje įmonėje dirba penki žmonės. Keturių jų atlyginimai yra 1000 eurų, o penktojo – įmonės vadovo – 10 000 eurų. Aritmetinis vidurkis tokiu atveju būtų 2800 eurų, tačiau šis skaičius nieko nesako apie eilinių darbuotojų realybę. Būtent čia į sceną žengia mediana. Tai statistinis rodiklis, kuris „padalija“ duomenų eilutę į dvi lygias dalis, nurodydamas tikrąjį vidurį. Suprasti, kas yra mediana ir kaip ją teisingai apskaičiuoti, yra būtinas įgūdis kiekvienam, norinčiam kritiškai vertinti informaciją, finansinius duomenis ar atlikti paprastus tyrimus.
Kas yra statistinė mediana?
Statistikoje mediana yra centrinis duomenų rinkinio skaičius, kai visi duomenys yra surikiuoti didėjimo arba mažėjimo tvarka. Jei aritmetinis vidurkis yra visų verčių suma, padalinta iš jų skaičiaus, tai mediana yra tiesiog „vidurinis taškas“. Jos pagrindinis privalumas yra tas, kad ji yra itin atspari kraštutiniams rodikliams (dar vadinamiems išskirtimis).
Tais atvejais, kai duomenų rinkinyje yra itin didelių arba itin mažų reikšmių, aritmetinis vidurkis gali būti iškraipytas. Mediana išlieka stabili ir rodo, kur yra ta riba, pusė kurios duomenų yra mažesni, o kita pusė – didesni. Tai ypač svarbu nagrinėjant pajamas, nekilnojamojo turto kainas ar kitus kintamučius, kur pasitaiko „anomalių“ skaičių.
Skirtumas tarp vidurkio ir medianos
Labai dažnai žmonės painioja vidurkį ir medianą, manydami, kad jie reiškia tą patį. Vis dėlto, tai du skirtingi matematiniai įrankiai, atliekantys skirtingas funkcijas.
- Aritmetinis vidurkis (mean): Tai visų stebėjimų suma, padalinta iš stebėjimų skaičiaus. Jis jautrus kiekvienai reikšmei. Jei į rinkinį įtrauksite labai didelį skaičių, vidurkis smarkiai pakils.
- Mediana (median): Tai pozicinė vertė. Jai svarbu tik tai, kokia yra duomenų eilės tvarka, o ne pačių skaičių dydis. Jei didžiausią rinkinio skaičių pakeisite dar didesniu (pvz., iš 10 000 padarysite 1 000 000), mediana nepasikeis, nes ji vis tiek liks „viduriniame taške“.
Šiuos rodiklius geriausia naudoti kartu. Jei vidurkis ir mediana yra labai panašūs, tai rodo, kad duomenys pasiskirstę tolygiai (simetriškai). Jei jie stipriai skiriasi, vadinasi, duomenų rinkinyje yra daug „išskirčių“, kurios „traukia“ vidurkį į vieną ar kitą pusę.
Kaip apskaičiuoti medianą: žingsnis po žingsnio
Medianos skaičiavimas yra gana paprastas, tačiau reikalauja atidumo. Procesą galima suskirstyti į aiškius žingsnius. Viskas priklauso nuo to, ar duomenų rinkinyje yra nelyginis, ar lyginis skaičių kiekis.
Pirmas žingsnis: duomenų rikiavimas
Pirmiausia visus turimus skaičius privalote surikiuoti didėjimo tvarka. Be šio žingsnio mediana bus neteisinga. Pavyzdžiui, turime seką: 7, 3, 1, 9, 5. Surikiavę gauname: 1, 3, 5, 7, 9.
Antras žingsnis: nelyginis duomenų skaičius
Jei skaičių kiekis yra nelyginis (kaip mūsų pavyzdyje – 5 skaičiai), mediana yra tiesiog skaičius, esantis tiksliai per vidurį. Mūsų atveju tai yra 5.
Trečias žingsnis: lyginis duomenų skaičius
Jei duomenų rinkinyje yra lyginis skaičių skaičius (pvz., 1, 3, 5, 7, 9, 11), per vidurį nėra vieno skaičiaus. Tokiu atveju reikia paimti du vidurinius skaičius (5 ir 7), juos sudėti ir padalyti iš dviejų. (5 + 7) / 2 = 6. Šiuo atveju 6 yra duomenų rinkinio mediana.
Kodėl mediana yra svarbi praktikoje?
Mediana yra plačiai naudojama ten, kur duomenys nėra vienalyčiai. Štai keletas pavyzdžių, kur šis rodiklis atlieka kritinį vaidmenį:
- Atlyginimų statistika: Valstybės institucijos dažnai skelbia vidutinį atlyginimą, tačiau jis dažnai atrodo didesnis nei realiai gauna dauguma gyventojų, nes jį „iškraipo“ labai dideli vadovų atlyginimai. Medianinis atlyginimas tiksliau parodo, ką uždirba „vidutinis“ darbuotojas.
- Nekilnojamasis turtas: Parduodamų butų kainos viename rajone gali labai skirtis. Vienas prabangus apartamentas už milijoną gali pakelti vidutinę kainą, tačiau mediana parodys tikrąją daugumos butų rinkos kainą.
- Socialiniai tyrimai: Kai tyrėjai nori sužinoti, kiek laiko žmonės praleidžia prie ekranų ar kiek valandų dirba, mediana leidžia išvengti rezultatų iškraipymo dėl „darboholikų“ arba žmonių, kurie visiškai neinicijuoja veiklos.
Dažniausiai užduodami klausimai (FAQ)
Kuo skiriasi moda, mediana ir vidurkis?
Vidurkis yra aritmetinė suma, mediana – centrinis taškas, o moda – tai dažniausiai pasikartojanti reikšmė duomenų rinkinyje. Kiekvienas jų suteikia skirtingą informaciją apie duomenis.
Ar mediana gali būti lygi vidurkiui?
Taip, tai įmanoma, jei duomenys yra pasiskirstę idealiai simetriškai. Pavyzdžiui, rinkinyje 2, 4, 6, 8, 10 mediana yra 6, ir vidurkis yra 6. Tai rodo visišką duomenų pusiausvyrą.
Kaip rasti medianą naudojant „Excel“ ar „Google Sheets“?
Tai itin paprasta. Tiesiog įrašykite formulę =MEDIANA(diapazonas) arba angliškoje versijoje =MEDIAN(range), kur „diapazonas“ yra jūsų duomenų langelių adresai (pvz., A1:A20). Programa automatiškai surikiuos skaičius ir pateiks rezultatą.
Ar mediana tinka visų tipų duomenims?
Mediana tinka tik skaitiniams arba kiekybiniams duomenims, kuriuos galima išrikiuoti. Ji netinka kategoriniams duomenims, pavyzdžiui, spalvoms ar prekės ženklams, kurių negalima natūraliai sudėlioti didėjimo tvarka.
Praktiniai patarimai analizuojant duomenis
Norint teisingai interpretuoti informaciją, neužtenka vien tik atlikti skaičiavimus. Būtina atsižvelgti į kontekstą. Jei matote bet kokią statistiką, visada užduokite sau klausimą: ar šiame rinkinyje yra kokių nors ekstremalių verčių? Jei taip, aritmetinis vidurkis gali jus apgauti.
Taip pat svarbu atkreipti dėmesį į imties dydį. Jei duomenų rinkinyje yra tik trys skaičiai, mediana nėra tokia informatyvi kaip tada, kai jų yra šimtai ar tūkstančiai. Didėjant imčiai, mediana tampa vis patikimesniu rodikliu, atspindinčiu bendrą tendenciją.
Analizuodami duomenis, stenkitės visada žiūrėti į „pasiskirstymą“. Jei turite prieigą prie duomenų vizualizavimo įrankių, nubraižykite histogramą. Pamatę grafinį vaizdą, akimirksniu suprasite, kodėl mediana yra būtent tokia, kokia yra, ir ar ji atitinka jūsų lūkesčius. Kartais vizualus duomenų pateikimas pasako daugiau nei patys skaičiai, tačiau mediana visada išliks svarbiu matematiniu ramsčiu, leidžiančiu pasakyti, kur yra tikrasis centras.
Galiausiai, nepamirškite, kad statistika yra įrankis. Ji negali pakeisti kritinio mąstymo, tačiau teisingas medianos supratimas ir pritaikymas leis jums geriau suprasti mus supančią aplinką – nuo asmeninių finansų iki visuomeninių procesų.
