Korelacija

Kaj je korelacija:

Korelacija pomeni podobnost ali odnos med dvema stvarma, ljudmi ali idejami . Gre za podobnost ali enakovrednost, ki obstaja med dvema različnima hipotezama, situacijami ali objekti.

Na področju statistike in matematike se korelacija nanaša na merilo med dvema ali več sorodnimi spremenljivkami.

Izraz korelacija je ženski samostalnik, ki izvira iz latinske korelacije.

Besedna korelacija se lahko nadomesti s sinonimi, kot so: relacija, enačba, povezava, korespondenca, analogija in povezava.

Koeficient korelacije

V statistiki Pearsonov korelacijski koeficient (r), ki se imenuje tudi korelacijski koeficient produktnega trenutka, meri razmerje med dvema spremenljivkama znotraj iste metrične skale.

Funkcija korelacijskega koeficienta je določiti intenzivnost razmerja med znanimi sklopi podatkov ali informacij.

Vrednost korelacijskega koeficienta se lahko spreminja med -1 in 1, dobljeni rezultat pa določa, ali je korelacija negativna ali pozitivna.

Za razlago koeficienta je potrebno vedeti, da 1 pomeni, da je korelacija med spremenljivkami popolna pozitivna in -1 pomeni, da je popolna negativna . Če je koeficient enak 0, to pomeni, da spremenljivke niso odvisne druga od druge.

V statistiki je tudi Spearmanov korelacijski koeficient, ki nosi to ime v čast statistiki Charlesu Spearmanu. Funkcija tega koeficienta je merjenje intenzivnosti razmerja med dvema spremenljivkama, ne glede na to, ali sta linearni ali ne.

Spearmanova korelacija služi za oceno, ali je intenzivnost razmerja med analiziranima spremenljivkama merljiva z monotono funkcijo (matematična funkcija, ki ohranja ali obrne začetno razmerje naročila).

Izračun Pearsonovega korelacijskega koeficienta

Metoda 1) Izračun Pearsonovega korelacijskega koeficienta z uporabo kovariance in standardnega odstopanja.

Kje?

S XY je kovarianca;

S x in S y predstavljajo standardni odmik spremenljivk x in y.

V tem primeru se pri izračunu najprej ugotovi kovarianca med spremenljivkami in standardni odmik vsakega od njih. Nato se kovarianca deli z množenjem standardnih odstopanj.

Pogosto je izjava že zagotovila bodisi standardna odstopanja spremenljivk bodisi kovarianco med njimi, samo z uporabo formule.

Metoda 2) Izračun Pearsonovega korelacijskega koeficienta s surovimi podatki (brez kovariance ali standardnega odklona).

S to metodo je najbolj neposredna formula:

Na primer, ob predpostavki, da imamo podatke z n = 6 opazovanji dveh spremenljivk: raven glukoze (y) in starost (x), izračun sledi naslednjim korakom:

Korak 1) Pripravite tabelo z obstoječimi podatki: i, x, y in dodajte prazne stolpce za xy, x² in y²:

2. korak: Pomnožite x in y, da izpolnite stolpec "xy". Na primer, v vrstici 1 bomo imeli: x1y1 = 43 × 99 = 4257.

3. korak: dvignite vrednosti stolpca x in zabeležite rezultate v stolpcu x². Na primer, v prvi vrstici bomo imeli x 1 2 = 43 × 43 = 1849.

Korak 4: Naredite enako kot v 3. koraku, zdaj uporabite stolpec y in zabeležite kvadrat vrednosti v stolpcu y². Na primer, v prvi vrstici bomo imeli: y 1 2 = 99 × 99 = 9801.

Korak 5: Pridobite vsoto vseh številk stolpcev in rezultat vstavite v podnožje stolpca. Na primer, vsota stolpca Age X je enaka 43 + 21 + 25 + 42 + 57 + 59 = 247.

Korak 6: Uporabite zgornjo formulo za pridobitev korelacijskega koeficienta:

Tako imamo:

Spearmanov korelacijski koeficient

Izračun Spearmanovega korelacijskega koeficienta je nekoliko drugačen. Za to moramo organizirati naše podatke v naslednji tabeli:

1. Po enunciated 2 pari podatkov, jih moramo uvesti v tabeli. Na primer:

2. V stolpcu "Uvrstitev A" razvrstimo opažanja, ki so v "Datumu A", z vedno večjo vrednostjo, pri čemer je "1" najnižja vrednost v stolpcu, en (skupno število opažanj), najvišja vrednost v stolpcu "Datum A" ". V našem primeru je:

3. Isto naredimo, da dobimo stolpec "Uvrstitev B", zdaj z opažanji v stolpcu "Podatki B":

4. V stolpcu "d" postavimo razliko med dvema uvrstitvama (A - B). Tu signal ni pomemben.

5. Dvignite vsako vrednost v stolpcu "d" in zapišite v stolpec d²:

6. Dodajte vse podatke iz stolpca "d²". Ta vrednost je Σd². V našem primeru Σd² = 0 + 1 + 0 + 1 = 2

7. Zdaj uporabljamo Spearmanovo formulo:

V našem primeru je n enak 4, ko pogledamo število vrstic podatkov (kar ustreza številu opazovanj).

8. Nazadnje, podatke nadomestimo s prejšnjo formulo:

Linearna regresija

Linearna regresija je formula, ki se uporablja za oceno možne vrednosti spremenljivke (y), kadar so znane druge spremenljivke (x). Vrednost "x" je neodvisna ali razlagalna spremenljivka in "y" je odvisna spremenljivka ali odziv.

Linearna regresija se uporablja za preverjanje, kako se lahko vrednost "y" spreminja kot funkcija spremenljivke "x". Vrstica, ki vsebuje vrednosti preverjanja variance, se imenuje linearna regresijska premica.

Če ima pojasnjevalna spremenljivka "x" eno samo vrednost, se bo regresija imenovala enostavna linearna regresija .