Analisis regresi berkaitan dengan ketergantungan statistik satu variabel pada variabel lainnya (satu atau lebih variabel lain). Tujuan dari analisis regresi adalah menprediksi atau memperkirakan nilai rata-rata atau rata-rata variabel dependen berdasarkan nilai-nilai yang diketahui dari variabel penjelasnya. Analisis regresi biasa dinotasikan dengan :
Dalam analisis regresi PRF adalah konsep yang ideal, karena
dalam prakteknya sulit atau jarang memilki akses ke seluruh populasi yang
diinginkan. Untuk mengatasi kesulitan tersebut seseorang biasanya mengambil
data sampe dari seluruh populasi.
Data sampel adalah sampel acak dari anggota populasi yang
diamati. Populasi biasa disimbolkan dengan “N” sedangkan data sampel
disimbolkan dengan “n”. Besar kecilnya ukuran sampel akan mempengaruhi semakin
tinggi pula tingkat kepercayaannya, begitu juga sebaliknya. Namun ukuran sampel
besar juga membutuhkan usaha dan waktu lebih dalam mendapatkannya.
Untuk data yang menggunakan data sampel, digunakan fungsi
regresi Sampel Regression Function (SRF) untuk memperkirakan PRF.
Konsep PRF dan SRF
PRF diperoleh dari data populasi dengan cara menghubungkan Conditional Mean. Analisis regresi untuk
PRF biasa dinotasikan dengan :
Fungsi tersebut menyatakan bahwa rata-rata (populasi) dari distribusi Yi untuk Xi tertentu berhubungan secara fungsional dengan Xi. Fungsi tersebut menyatakan bagaimana nilai rata-rata (populasi) bervariasi bersama dengan X1.
SFR diperoleh dari data sampel dengan cara metode Least Square atau metode kuadrat
terkecil. SFR dikenal juga dengan
stotatik (sampel) suatu formula yang menyatakan bagaimana untuk menaksir
parameter populasi dari informasi yang dimiliki pada sampel. Analisis regresi
untuk SRF biasa dinotasikan dengan :
10 Asumsi yang Mendasari Linear Regression Model
1. Model regresi linear
Model regresi haruslah linear, meski bisa saja sebenarnya
variabel dependen Y dengan variabel X tidak linear.
2. Nilai Y ditetapkan dalam pengambilan sampel berulang
Nilai variabel X diasumsikan stotastik atau dianggap tetap dalam
sampel yang berulang.
3. Nilai rata-rata nol dari Random Error ui
Nilai Y yang diprediksi dengan model regresi tentunya mempunyai
perbedaan atau kesalahan dengan nilai Y pada data. Selisih kesalahan tersebut
biasa disimbolkan ui.
4. Homokedastisitas atau varians yang sama dari ui
Populasi Y yang berkorespondensi dengan berbagai nilai X
memiliki nilai random error yang sama.
5. Tidak ada autokorelasi antara random error
Untuk sembarang 2 buah nilai X, maka kedua error itu tidak
berkorelasi (atau mempunyai korelasi 0).
6. Nol kovarians antara ui dan Xi
Nilai variabel independen (Xi) dengan random error (ui)
tidak berkolerasi.
7. Jumlah pengamatan n harus lebih besar dari jumlah parameter
yang akan diestimasi.
8. Variabilitas dalam nilai X
Harus ada variasi nilai dalam variabel X
9. Model regresi ditentukan
dengan benar
Model regresi yang dibangun haruslah benar dalam arti sesuai
dengan teori yang telah dikembangkan.
10. Tidak ada multilinearitas yang sempurna
Tidak ada hubungan linear yang sempurna antara variabel
penjelas, variabel harus independen.
Wah keren, bermanfaat banget kak
BalasHapushalo kak, mantap banget kak :)) thx u ya
BalasHapus