BAB II
PEMBAHASAN
A.
Pengertian
regresi
Sering kali peneliti
ingin melihat kondisi di waktu yang akan datang dengan suatu dasar keadaan
sekarang atau ingin melihat kondisi di waktu yang lalu dengan dasar keadaan
sekarang. Sifat ini melakukan prediksi atau taksiran mulai berkembang dalam
dunia ekonomi, tetapi sekarang banyak dilakukan di dunia pendidikan. Bahkan
dewasa ini, melakukan prediksi siswa untuk waktu yang akan datang merupakan
kondisi yang sangat dibutuhkan dalam dunia pendidikan, baik yang menyangkut
kurikulum, metode mengajar, fasilitas ruang dan guru, dan lain-lainnya, akan
dapat direalisasikan seefisien mungkin.
Pada pembahasan bab
ketujuh kita telah membahas korelasi antara satu variabel dengan variabel yang
lainnya. Hubungan yang telah dibahas dimuka merupakan hubungan yang bersifat
korelasional, artinya mana yang sebgai sebab dan mana yang menjadi akibat
tidaklah jelas.
Dalam melakukan
prediksi, kita harus dapat menentukan dengan tegas mana yang sebab dan mana
yang akibat (tentunya dengan bantuan kajian teoritis). Dengan diketahuinya
sebab dan akibat, maka hubungan yang dicari bersifat kausal (sebab akibat).
Selanjutnya, jika kita tahu tentang variabel sebab (variabel bebas), maka kita
akan dapat melakukan prediksi tentang kondisi variabel akibat (variabel
terikatnya).
Sebagaimana layaknya
arti kata prediksi, prediksi di sini pun bukanlah merupakan hal yang pasti,
tetapi merupakan suatu keadaan yang mendekati kebenaran. Jika kita
membandingkan nilai variabel yang kita predik dengan nilai prediksinya
berkemungkinan besar akan terdapat perbedaan. Perbedaan tersebut bisa terlalu
besar maupun terlalu kecil. Sepanjang perbedaan tersebut tidak besar, maka
prediksi yang kita lakukan merupakan hasil kerja yang luar biasa.
Penyimpangan-penyimpangan nilai asli dan nilai prediksi ini sering terjadi
karena dalam melakukan prediksi kita berdasarkan nilai rata-rata, dan
menggunakan suatu persamaan yang menggambarkan suatu garis tertentu. Sifat yang
menggambarkan garis bermacam-macam, ada yang lurus, hiperbola dan lainnya.
Untuk menentukan rumus mana yang diperoleh, karena masing-masing rumus
dikembangkan melalui beberapa asumsi.
Salah satu syarat
untuk dapat melakukan prediksi atas variabel terikat di waktu yang akan datang,
maupun di dalam populasinya, dengan dasar beberapa skor variabel bebas dan
variabel terikat (sebagai sampel) adalah adanya hubungan yang signifikan antara
variabel bebas dan variabel terikat. Sebenarnya statistik tidak dapat
membedakan antara data yang mempunyai hubungan secara teoritis maupun tidak,
oleh karena itu hasil analisis statistik bisa menyesatkan jika dasar
teoritisnya tidak kuat.
Adapun beberapa pola persamaan regresi
dengan satu variabel bebas yang dapat digunakan untuk melakukan prediksi, di
antaranya:
1. Linier dengan
persamaan: Y=a + Bx
2. Parabola dengan
persamaan: Y = a + bX +cX2
3. Hiperbola dengan
persamaan: Y= 1 /(a+bX)
4. Fungsi pangkat tiga
dengan persamaan: Y=a+bX+cX2+dX3
5. Dan lain-lain.
Sedangkan regresi
dengan variabel bebas lebih dari satu sampai saat ini baru dikembangkan dengan
model linier yang rumus persamaannya: Y = a + b1X1 +b2X2
+biXi’
B. Regresi linier
sederhana
Pembahasan pada sub
bab ini dititikberatkan pada pembahasan regresi linier dengan satu variabel
nbebas. Kita mulai dengan linier sederhana ditunjukkan untuk mempermudah
pemahaman konsep regresi, karena model inilah yang paling sederhana dibanding
dengan model-model lainnya. Tanpa mendalami dan memahami model-model lainnya.
Untuk mempermudah
pemahaman regresi perlu kita kembali pada pola penyebaran skor (titik-titik
penyebaran skor) yaitu titik-titik perpotongan antara nilai X dan Y.
Misalnya, kita
mempunyai data dari dua variabel yaitu variabel intelegensi (X) dan variabel
hasil belajar (Y), yang penyebarannya sebagai berikut:
X
|
90
|
100
|
100
|
95
|
105
|
110
|
105
|
105
|
115
|
120
|
Y
|
70
|
75
|
80
|
80
|
85
|
85
|
85
|
90
|
95
|
100
|
Jika antara titik
satu dengan yang lainnya dihubungkan dengan suatu garis, maka akan diperoleh
garis yang tidak lurus,. Tetapi jika diambil suatu garis yang mewakili
rata-rata dari seluruh titik tersebut, maka akan diperoleh garis lurus. Garis
lurus itulah yang merupakan garis regresi linier.
Melalui persamaan
garis lurus itulah kita dapat melakukan prediksi rata-rata nilai variabel
terikat. Jadi dengan mengetahui nilai variabel bebas kita dapat mengetahui
rata-rata nilai variabel terikatnya. Tentuny adengan kondisi dan situasi yang
tidak berbeda dnegan sampel, atau dengan kata lain nilai yang dipredik terbatas
pada populasi yang diambil sampel. Apabila kita ingin menerapkan hasil prediksi
tersebut pada populasi yang lain, maka populasi tersebut harus mempunyai
kriteria yang sama dengan populasi yang diambil dengan sampelnya. Nilai
prediksi belum tentu sama dengan nilai aslinya. Hal ini disebabkan oleh karena
yang diprediksi adalah nilai rata-ratanya. Dengan demikian, nilai prediksi
dapat dikatakan baik apabila nilai prediksi tidak jauh menyimpang (kalau
mungkin sama) dari nilai aslinya. Ini berarti bahwa rata-rata simpangan nilai
asli dengan nilai rata-ratanya tidak terlalu besar (kalau mungkin nol).
Rumus persamaan regresi linier Y = a +bX bukan merupakan persamaan
yang tepat, artinya persamaan tersebut merupakan pendekatan persamaan Y = a +
bX. Persamaan yang sebenarnya terlalu sukar untuk dihitung (walaupun sebenarnya
dapat dihitung dengan bantuan komputer yang canggih) sehingga hasil perhitungan
a dan b yang merupakan pendekatan α dan β perlu diuji kecocokannya. Jika ternyata a
berfungsi sebagai pengganti berfungsi sebagai pengganti β, maka persamaan di atas dapat digunakan
sebagai pengganti persamaan sebenarnya, yang fungsinya untuk melakukan
prediksi.
Nilai a dan nilai b dapat dihitung melalui
rumus yang sederhana, sehingga tidak perlu ditakuti. Untuk memperoleh nilai a
dapat digunakan rumus.
Sedangkan
nilai b dapat dihitung dengan rumus 7.2.
Setelah nilai a dan b dapat dihitung, langkah selanjutnya adalah
menguji apakah nilai a dan b memang dapat mewakili nilai α dan β. Untuk
pengujian di sini kita perlu melihat beberapa variasi yang mungkin muncul, dan
melihat apakah variasi-variasi tersebut terlalu besar atau tidak.
Beberapa variasi yang perlu dilihat adalah:
1.
Variasi
kekeliruan taksiran (standard error estimate) yang dapat dihitung dengan
rumus 7.3.
Rumus
7.3 menuntut perhitungan yang agak rumit karena faktor yang dikandung dalam
rumus tersebut melibatkan simpangan masing-masing skor Y dengan nilai
taksirannya (
).
Mengingat kesukaran tersebut maka variasi kekeliruan taksiran dapat
dihitung dengan rumus 7.4. yang lebih sederhana sbb.:
Untuk menghitung variasi X maupun variasi Y digunakan rumus 2.15.
Di samping itu, variasi masing-masing variabel dapat dihitung dengan rumus 7..
Keterangan:
SS merupakan sum of squarres (jumlah
kuadrat) yaitu jumlah kuadrat simpangan masing-masing nilai dengan
rata-ratanya.
2.
Variasi
koefisien regresi terdiri dari dua macam:
a.
Koefisian
regresi dihitung dengan rumus 7.6.
b.
Koefisien
regresi b dihitung dengan rumus 7.7.
3.
Variasi
ramalan Y untuk setiap X:
a.
Rata-rata
ramalan dihitung dengan rumus 7.8.
b.
Ramalan
individu dihitung dengan rumus 7.9.
Contoh
soal 58 di atas jika dihitung nilai a, b, dan variasinya sbb.:
Langkah
pertama: membuat tabel penyebaran nilai menjadi sbb.:
X
|
Y
|
|
|
XY
|
120
|
100
|
14400
|
10000
|
12000
|
115
|
95
|
13225
|
9025
|
10925
|
110
|
85
|
12100
|
7225
|
9350
|
105
|
90
|
11025
|
8100
|
9450
|
105
|
85
|
11025
|
7225
|
8925
|
105
|
85
|
11025
|
7225
|
8925
|
100
|
80
|
10000
|
6400
|
8000
|
100
|
75
|
10000
|
5625
|
7500
|
95
|
80
|
9025
|
6400
|
7600
|
90
|
70
|
8100
|
4900
|
6300
|
1045
|
845
|
109925
|
72125
|
88975
|
Sedangkan
selisih setiap nilai X dengan rata-ratanya:
X
|
|
|
|
120
|
104,5
|
15,5
|
240,25
|
115
|
104,5
|
10,5
|
110,25
|
110
|
104,5
|
5,5
|
30,25
|
105
|
104,5
|
0,5
|
0,25
|
105
|
104,5
|
0,5
|
0,25
|
105
|
104,5
|
0,5
|
0,25
|
100
|
104,5
|
-4,5
|
20,25
|
100
|
104,5
|
-4,5
|
20,25
|
95
|
104,5
|
-9,5
|
90,25
|
90
|
104,5
|
-14,5
|
210,25
|
0
|
722,5
|
Selain kita mencari selisih setiap nilai X dengan rata-ratanya,
kita perlu membuat tabel selisih setiap nilai Y rata-ratanya. Hal ini
disebabkan perhitungan-perhitungan selanjutnya akan banyak menggunakan jumlah
kuadrat simpangan nilai X maupun Y dengan rata-ratanya. Selisih nilai Y dengan
rata-ratanya.
Y
|
|
|
|
100
|
84,5
|
15,5
|
240,25
|
95
|
84,5
|
10,5
|
110,25
|
85
|
84,5
|
0,5
|
0,25
|
90
|
84,5
|
5,5
|
30,25
|
85
|
84,5
|
0,5
|
0,25
|
85
|
84,5
|
0,5
|
0,25
|
80
|
84,5
|
-4,5
|
20,25
|
75
|
84,5
|
-9,5
|
90,25
|
80
|
84,5
|
-4,5
|
20,25
|
70
|
84,5
|
-14,5
|
210,25
|
0
|
722,5
|
Berdasarkan
kedua tabel di atas dapat dihitung a, b, serta variasi sbb.:
Sebelum kita menghitung rata-rata kuadrat penyimpangan sekitar
regresi, kita perlu menghitung variasi masing-masing variabel sbb.:
80,27777778
=80,28
80,27777778
=80,28
Hasil perhitungan variasi masing-masing
variabel kita masukkan dalam rumus rata-rata kuadrat penyimpanan sekitar
regresi, sehingga hasilnya:
S2Y.X =
{(80,28
– (0,932 x 80,28)}
=
S2b = S2Y .X / ∑ (X -
2
= 12,20 : 722,5 = 0,016887967
= 0,0087
S2a = S2Y.X
}
= 12,20 (1/10 + 10920,25/722,5)
= 19,6597301
= 19,66
Variasi ramalan individu Y untuk X yang
diketahui ( untuk X = 100) adalah :
S2Y = S2Y.X {
= 12,2 {(1/10 + (100 – 104,5)2 : 722,5}
= 13,76193772 = 13,76
C.
Pengujian
signifikan Koefisien Regresi
Mengingat koefisien regresi yang sangat
mempengaruhi nilain taksiran adalah b, maka pengujian disini cukup hanya
menguji signifikan koefisien regresi b. Walaupun demikian masih dimungkinkan
untuk melakukan pengujian signifikan koefisien regresi a, sebagai penguasan
peneliti. Pengujian kedua koefisien regresi ini mempunyai langkah yang sama.
Korelasi variabel X dengan variabel Y dapat
pula dihitung dengan rumus.\
r =
korelasi juga dapat dihitung dengan rumus.
r2 =
= 0,9212755356
jadi, r =
= 0,9598309932 = 0,96
Setelah kita dapat menghitung besarnya hubungan
antara variabel bebas dan variabel terikat , maka langkah selanjutnya adalah
melakukan penafsiran. Dalam melakukan penafsiran kita gunakan koefisien
determinasinya yaitu kuadrat koefisien korelasi, pada contoh di atas koefisien
determinasinya adalah 0,92. Ini berarti bahwa kira-kira 92% variasi pada Y
dapat diterapkan oleh X, sedangkan sisanya yang 8% dari penyimpanan-penyimpanan
nilai Y tidak dapat diterapkan oleh variabel X. Tentunya kondisi pada contoh
soal ini sangat baik, tetapi jika kita masih ragu atas hasil perhitungan
koefisien korelasi, maka harus dilakukan pengujian kesignifikansian koefisien
korelasi tersebut (ingat ujian signifikansi korelasi). Dalam soal diatas
koefisien korelasi ternyata signifikan.
Secara singkat langkah-langkah dalam
perhitungan regresi linier sederhana adalah:
1)
Meghitung
nilai a dan b untuk menentukan persamaan regresi linier sederhana.
2)
Menguji
signifikan koefisien regresi
3)
Menghitung
variasi untuk selanjutnya digunakan untuk menentukan standard error penafsiran
4)
Menentukan
confidence dari penafsiran
5)
Menghitung
koefisien korelasi, untuk menghitung koefisien determinasi
6)
Menguji
signifikansi daripada koefisien korelasi
7)
Melakukan
interprestasi
Langkah lain untuk menguji hipotesis berkaitan dengan regresi
linier adalah melalui analisis variasi. Dalam hal ini kita akan berhubungan
dengan jumlah kuadrat (sum of squares) dari masing-masing variabel.
Disini jumlah kuadrat variabel terikat merupakan juml;ah dari kuadrat: kuadrat
jumlah Y dibagi dnegan jumlah hasil kali simpangan masing-masing variabel
dengan rata-ratanya, dan juml;ah kuadrat simpangan Y dengan ý.
Dengan demikian maka sumber variasi terdiri dari 3 macam, yaitu:
1)
Regresi
a, dengan derajat kebebasan 1.
2)
Regresi
(b/a), dengan derajat kebebasan 1.
3)
Sisa,
dengan derajat kebebasan n-2.
Dari ketiga sumber variasi di atas kita dapat menghitung dari
masing-masingnya berupa sum of squares. Sum of squares yang berkaitan
dengan regresi a dapat dihitung dengan rumus.
SSa = (∑Y)2 / n
Untuk contoh diataas SSa adalah:
= 714025 : 10
= 71402,5
sum of squares yang
berkaitan dengan regresi b/a dapat dihitung dengan rumus.
SSb/a = b{∑XY-
Untuk contoh nilai SSb/a adalah:
= 0,93 [88975-{(1045 x 845) : 10}]
=625,425
Sum of squares
sisa dapat dihitung dengan rumus.
SSsisa = ∑Y2 – SSa – SSb/a
Untuk contoh diatas, nilai SSsisanya adalah:
72125 – 71402,5 – 625,425
=97,075
Mean squares yang berkaitan dengan regresi a dapat dihitung dengan
rumus.
MSa = SSa / dk SSa
Untuk contoh diatas mean squares nya adalah:
=71402,5 : 1
=71402,5
Mean squares yang berkaoitan dengan regresi b/a dapat dihitung
dengan rumus.
MSb/a = SSb/a / dk SSb/a
= 625,425 : 1
=625,425
Mean squares yang berkaitan dengan regresi sisa dihitung dengan
rumus.
MSsisa = SSsisa / dk SSsisa
=97,075 : 8
=12,134375
Tahap akhir dalam pengujian hipotesis signifikansi kontribusi atau
sumbangan variabel X terdapat variabel Y adalah menghitung variabel F yang
dapat diperoleh dengan rumus.
F = MSb/a
: MSsisa
=625,425 :
12,134375
=51,54159155 =
51,54
Setelah nilai F hitung diperoleh, maka kita akan menerima atau
menolak H0 dengan jalan membandingkan nilai F hitung dengan nilai F tabel.
Langkah-langkah tersebut akan menghasilkan analisis yang baik jika
beberapa syarat telah terpenuhi. Oleh karena itu, sebelum kita beranjak lebih
baik kita menguji apakah kondisi data sampel kita telah memenuhi seluruh
persyaratan analisis regresi atau tidak. sedangkan syarat-syarat yang harus
dipenuhi dalam perhitungan diatas adalah:
1)
Sampel
diambil secara random (acak).
2)
Variabel
X dan variabel Y mempunyai hubungan yang kausal, dimana X merupakan sebab dan Y
merupakan akibat.
3)
Nilai
Y mempunyai penyebaran yang berdistribusi normal.
4)
Persamaan
tersebut hendaknya benar-benar linier.
D.
Uji
Linier Regresi Sederhana
Pada pembahasan yang lalu
kita tidak secara teliti dan terperinci membahas tentang linieritas dari
persamaan regresi yang kita peroleh. pada saat pengujian signifikansi koefisien
regresi soal no. 58 telah kita simpulkan bahwa koefisien regresi adalah
signifikan dan linier. Untuk lebih telitinya analisis, masih perlu dilakukan
analisis terpisah tentang apakah persamaan regresi yang diperoleh itu linier
atau tidak. jika ternyata persamaan linier barulah bisa digunakan untuk
melakukan prediksi dengan bentuk linier, sebaliknya jika ternyata persamaan
yang di peroleh tidak linier, maka kita perlu menggunakan persamaan lain yang
lebih cocok. Pada pembahasan yang lalu pun telah disinggung selintas pengujian
linieritas dengan “least squares”. Jika jumlah data tidak banyak, least squares
memang bisa membantu peneliti untuk melihat bentuk persamaan. Tetapi, jika
jumlah sumpel yang dihadapi banyak, maka pengamatan melalui least squares bisa
menyesatkan. Di samping itu, least squares tergantung pada pengamatan mata
semata. Untuk itulah least squares perlu disertai dengan bentuk pengujian
linearitas.
Pengujian linearitas
berkaitan dengan sum of squares sisa, dimana sum squares sisa dipisah menjadi
dua bagian yaitu sum of squares ketidaksamaan, dan sum of squares error. Dalam
membahas ketidaksamaan kita perlu melihat (mengelompokkan) Y berdasarkan nilai
X, artinya kita cari simpangan nilai Y dalam setiap kelompok X . sehingga
banyaknya derajat kebebasannya adalah k (banyak kelompok X) dikurang dengan 2.
Sedangkan sum of squares error merupakan selisih sumof squares sisa dengan sum
of squares ketidaksamaan, dengan derajat kebebasan n-k.
Untuk lebih jelasnya marilah kita uji
linearitas contoh soal No. 58 dimuka.
Langkah adalah menyusun penyebaran nilai-nilai data Y berdasarkan
nilai X.
Penyebaran nilai pengamatan Y berdasarkan nilai X untuk soal no. 58
sebagai berikut:
X
|
Y
|
120
|
100
|
115
|
95
|
110
|
85
|
105
|
90
|
105
|
85
|
105
|
85
|
100
|
80
|
100
|
75
|
95
|
80
|
90
|
70
|
Berdasarkan tabel di atas dapat dihitung sum of squares error
(SSerror) dengan rumus sebagai berikut:
SSerror = x∑k(∑Y2 –
Keterangan:
x∑k merupakan jumlah simpangan setiap Y yang
didasarkan pada pengelompokan (persamaan nilain )X
nk merupakan jumlah n di setiap
kelompok
untuk contoh soal No. 58 di atas squares
ketidaksamaannya sebagai berikut:
SSerror = (1002 -
) + (952 -
) + (852 -
) + (902
+ 852 + 852 –
) + (802+752
) + (802
-
) + (702
-
) = 0 + 0 + 0
+16,667 + 12,5 +0 +0 = 29,167
SSketidaksamaan = SSsisa
- SSerror
=
97,075 – 29,167
=
67,908
MSketidaksamaaan= SSketidaksamaan
: dk SSketidaksamaan
=67,908
: (7-2)
=13,5816
MSerror =SSerror : dk SSerror
=29,167
: (10-7))
=9,722333333
=9,7223
Untuk linieritas kita akan menggunakan F tes,
sedangkan hipotesisnya sebagai berikut:
H0 : persamaan regresi linier
H1 : persamaan regresi tak linier
Sedangkan F hitung dicari dengan rumus
F = MSketidaksamaaan : MSerror
Untuk soal No. 58 di atas F hitungnya adalah:
F =
13,5816 : 9,7233
=1,396809725 = 1,40
Jika mengambil alpha (α) 0,05, maka F0,05(5,3)=9,01 (lihat
tabel F).
Oleh karena F hitung lebih kecil daripada F
tabel maka kita akan menerima Hipotesis yang mengatakan bahwa persamaan regresi
yang diperoleh yaitu ý
= -12,77 + 0,93 X merupakan persamaan regresi linier. Dengan demikian kita
tidak perlu mencari model persamaan lain, sebaliknya apabila kita ternyata
persamaan regresi yang diperoleh tidak linier, maka kita harus mencari
persamaan model lain.
Jika kita digabungkan hasil analisis variance
tentang signifikansi koefisien regresi dan linieritas persamaan regresi, maka
tabel anovanya sebagai berikut:
sumber variansi
|
dk
|
SS
|
MS
|
F
|
total
|
10
|
72125
|
||
regresi a
|
1
|
71402,5
|
71402,5
|
|
regresi b/a
|
1
|
625,425
|
625,425
|
51,54
|
sisa
|
8
|
97,075
|
12,13438
|
|
ketidaksamaan
|
5
|
67,908
|
13,5816
|
1,4
|
error
|
3
|
29,167
|
9,7223
|
Catatan: uji linieritas mempunyai kriteria penerimaan hipotesis nol terbaik dengan kriteria yang lainnya.
DAFTAR PUSTAKA
Indrianto, Agus. Statistik Dasar Aplikasi dan Pengembangannya.
Jakarta : prenada media group. 2010.