Regresijska analiza je jedna od najtraženijih metoda statističkog istraživanja. Pomoću njega možete postaviti stepen uticaja nezavisnih varijabli na zavisnu varijablu. Microsoft Excel ima alate za obavljanje ove vrste analiza. Pogledajmo šta su i kako ih koristiti.
Paket za analizu veze
Ali, da biste koristili funkciju koja omogućava regresijsku analizu, prvo morate aktivirati paket analize. Tek tada će se alati potrebni za ovu proceduru pojaviti na Excel traci.
- Pređite na karticu "Datoteka".
- Idite na odeljak "Opcije".
- Otvara se prozor Excel opcija. Idite na pododeljak Dodaci.
- Na dnu prozora koji se otvara, preuredite prekidač u bloku "Upravljanje" u poziciji Excel-ovi dodaciako je u drugom položaju. Pritisnemo dugme "Idi".
- Otvara se prozor dodataka za Excel. Stavite kvačicu pored stavke "Analizni paket". Kliknite na dugme "OK".
Sada kada idemo na tabulator "Data", na traci u bloku alata "Analiza" videćemo novo dugme - "Analiza podataka".
Vrste regresijske analize
Postoji nekoliko tipova regresija:
- parabolic;
- power;
- logaritamska;
- eksponencijalan;
- indikativan;
- hyperbolic;
- linearna regresija.
Više ćemo govoriti o implementaciji posljednje vrste regresijske analize u Excelu.
Linearna regresija u Excelu
U nastavku, kao primjer, prikazana je tablica koja pokazuje prosječnu dnevnu temperaturu zraka na ulici, te broj kupaca trgovine za odgovarajući radni dan. Uz pomoć regresione analize saznajte kako tačno vremenski uvjeti u obliku temperature zraka mogu utjecati na posjećenost komercijalnog objekta.
Opšta regresiona jednadžba linearnog tipa je:Y = a0 + a1x1 + ... + akhk
. U ovoj formuli Y znači varijabla, uticaj faktora na koje pokušavamo da proučavamo. U našem slučaju, ovo je broj kupaca. Značenje x - to su različiti faktori koji utiču na varijablu. Parametri a su koeficijenti regresije. Odnosno, oni određuju značaj određenog faktora. Indeks k označava ukupan broj ovih faktora.
- Kliknite na dugme "Analiza podataka". Nalazi se na kartici. "Home" u bloku alata "Analiza".
- Otvara se mali prozor. U njemu izaberite stavku "Regresija". Pritisnemo dugme "OK".
- Otvara se prozor za podešavanje regresije. U njemu su obavezna polja "Ulazni interval Y" i "Interval ulaza X". Sva ostala podešavanja mogu biti ostavljena kao podrazumevana.
Na terenu "Ulazni interval Y" specificiramo adresu opsega ćelija u kojima se nalaze varijabilni podaci, uticaj faktora na koje pokušavamo da uspostavimo. U našem slučaju, to će biti ćelije u stupcu "Broj kupaca". Adresa se može uneti ručno pomoću tastature, ili možete jednostavno odabrati željenu kolonu. Druga opcija je mnogo lakša i praktičnija.
Na terenu "Interval ulaza X" unesite adresu opsega ćelija u kojoj se nalaze podaci faktora, čiji je uticaj na varijablu koju želimo postaviti. Kao što je gore navedeno, potrebno je odrediti uticaj temperature na broj kupaca u skladištu, te stoga unijeti adresu ćelija u stupac "Temperatura". To se može učiniti na isti način kao u polju "Broj kupaca".
Pomoću drugih podešavanja možete postaviti oznake, nivo pouzdanosti, konstantno-nula, prikazati graf normalne vjerovatnoće i izvesti druge radnje. Ali, u većini slučajeva, ova podešavanja ne moraju da se menjaju. Jedina stvar na koju treba obratiti pažnju su izlazni parametri. Po defaultu, rezultati analize se prikazuju na drugom listu, ali preraspodjelom prekidača, možete postaviti izlaz u navedenom rasponu na istom listu gdje se nalazi tablica s izvornim podacima, ili u zasebnoj knjizi, odnosno u novoj datoteci.
Nakon što su sva podešavanja podešena, kliknite na dugme. "OK".
Analiza rezultata analize
Rezultati regresijske analize prikazani su u tablici na mjestu naznačenom u postavkama.
Jedan od glavnih indikatora je R-kvadrat. To ukazuje na kvalitet modela. U našem slučaju ovaj odnos je 0,705, odnosno oko 70,5%. Ovo je prihvatljiv nivo kvaliteta. Zavisnost manja od 0,5 je loša.
Drugi važan indikator nalazi se u ćeliji na preseku linije. "Y-presek" i kolona Odds. Pokazuje koja će vrijednost biti u Y, au našem slučaju to je broj kupaca, pri čemu su svi ostali faktori jednaki nuli. U ovoj tabeli ova vrijednost je 58,04.
Vrednost na preseku grafikona "Variable X1" i Odds pokazuje nivo zavisnosti Y od X. U našem slučaju, to je nivo zavisnosti broja kupaca u skladištu od temperature. Koeficijent 1,31 smatra se prilično visokim pokazateljem uticaja.
Kao što možete vidjeti, korištenje programa Microsoft Excel je prilično lako stvoriti tablicu regresijske analize. Ali, samo obučena osoba može raditi sa izlaznim podacima i razumjeti njihovu suštinu.