Thursday, 2 June 2016

CONTOH MAKALAH JADI TENTANG Makalah Analisis Regresi Linier Sederhana Zaki Hidayat




BAB II
PEMBAHASAN

A.    Pengertian regresi
Sering kali peneliti ingin melihat kondisi di waktu yang akan datang dengan suatu dasar keadaan sekarang atau ingin melihat kondisi di waktu yang lalu dengan dasar keadaan sekarang. Sifat ini melakukan prediksi atau taksiran mulai berkembang dalam dunia ekonomi, tetapi sekarang banyak dilakukan di dunia pendidikan. Bahkan dewasa ini, melakukan prediksi siswa untuk waktu yang akan datang merupakan kondisi yang sangat dibutuhkan dalam dunia pendidikan, baik yang menyangkut kurikulum, metode mengajar, fasilitas ruang dan guru, dan lain-lainnya, akan dapat direalisasikan seefisien mungkin.
Pada pembahasan bab ketujuh kita telah membahas korelasi antara satu variabel dengan variabel yang lainnya. Hubungan yang telah dibahas dimuka merupakan hubungan yang bersifat korelasional, artinya mana yang sebgai sebab dan mana yang menjadi akibat tidaklah jelas.
Dalam melakukan prediksi, kita harus dapat menentukan dengan tegas mana yang sebab dan mana yang akibat (tentunya dengan bantuan kajian teoritis). Dengan diketahuinya sebab dan akibat, maka hubungan yang dicari bersifat kausal (sebab akibat). Selanjutnya, jika kita tahu tentang variabel sebab (variabel bebas), maka kita akan dapat melakukan prediksi tentang kondisi variabel akibat (variabel terikatnya).
Sebagaimana layaknya arti kata prediksi, prediksi di sini pun bukanlah merupakan hal yang pasti, tetapi merupakan suatu keadaan yang mendekati kebenaran. Jika kita membandingkan nilai variabel yang kita predik dengan nilai prediksinya berkemungkinan besar akan terdapat perbedaan. Perbedaan tersebut bisa terlalu besar maupun terlalu kecil. Sepanjang perbedaan tersebut tidak besar, maka prediksi yang kita lakukan merupakan hasil kerja yang luar biasa. Penyimpangan-penyimpangan nilai asli dan nilai prediksi ini sering terjadi karena dalam melakukan prediksi kita berdasarkan nilai rata-rata, dan menggunakan suatu persamaan yang menggambarkan suatu garis tertentu. Sifat yang menggambarkan garis bermacam-macam, ada yang lurus, hiperbola dan lainnya. Untuk menentukan rumus mana yang diperoleh, karena masing-masing rumus dikembangkan melalui beberapa asumsi.
Salah satu syarat untuk dapat melakukan prediksi atas variabel terikat di waktu yang akan datang, maupun di dalam populasinya, dengan dasar beberapa skor variabel bebas dan variabel terikat (sebagai sampel) adalah adanya hubungan yang signifikan antara variabel bebas dan variabel terikat. Sebenarnya statistik tidak dapat membedakan antara data yang mempunyai hubungan secara teoritis maupun tidak, oleh karena itu hasil analisis statistik bisa menyesatkan jika dasar teoritisnya tidak kuat.
Adapun beberapa pola persamaan regresi dengan satu variabel bebas yang dapat digunakan untuk melakukan prediksi, di antaranya:
1.      Linier dengan persamaan: Y=a + Bx
2.      Parabola dengan persamaan: Y = a + bX +cX2
3.      Hiperbola dengan persamaan: Y= 1 /(a+bX)
4.      Fungsi pangkat tiga dengan persamaan: Y=a+bX+cX2+dX3
5.      Dan lain-lain.
Sedangkan regresi dengan variabel bebas lebih dari satu sampai saat ini baru dikembangkan dengan model linier yang rumus persamaannya: Y = a + b1X1 +b2X2 +biXi’
B.     Regresi linier sederhana
Pembahasan pada sub bab ini dititikberatkan pada pembahasan regresi linier dengan satu variabel nbebas. Kita mulai dengan linier sederhana ditunjukkan untuk mempermudah pemahaman konsep regresi, karena model inilah yang paling sederhana dibanding dengan model-model lainnya. Tanpa mendalami dan memahami model-model lainnya.
Untuk mempermudah pemahaman regresi perlu kita kembali pada pola penyebaran skor (titik-titik penyebaran skor) yaitu titik-titik perpotongan antara nilai X dan Y.
Misalnya, kita mempunyai data dari dua variabel yaitu variabel intelegensi (X) dan variabel hasil belajar (Y), yang penyebarannya sebagai berikut:
X
90
100
100
95
105
110
105
105
115
120
Y
70
75
80
80
85
85
85
90
95
100

Jika antara titik satu dengan yang lainnya dihubungkan dengan suatu garis, maka akan diperoleh garis yang tidak lurus,. Tetapi jika diambil suatu garis yang mewakili rata-rata dari seluruh titik tersebut, maka akan diperoleh garis lurus. Garis lurus itulah yang merupakan garis regresi linier.
Melalui persamaan garis lurus itulah kita dapat melakukan prediksi rata-rata nilai variabel terikat. Jadi dengan mengetahui nilai variabel bebas kita dapat mengetahui rata-rata nilai variabel terikatnya. Tentuny adengan kondisi dan situasi yang tidak berbeda dnegan sampel, atau dengan kata lain nilai yang dipredik terbatas pada populasi yang diambil sampel. Apabila kita ingin menerapkan hasil prediksi tersebut pada populasi yang lain, maka populasi tersebut harus mempunyai kriteria yang sama dengan populasi yang diambil dengan sampelnya. Nilai prediksi belum tentu sama dengan nilai aslinya. Hal ini disebabkan oleh karena yang diprediksi adalah nilai rata-ratanya. Dengan demikian, nilai prediksi dapat dikatakan baik apabila nilai prediksi tidak jauh menyimpang (kalau mungkin sama) dari nilai aslinya. Ini berarti bahwa rata-rata simpangan nilai asli dengan nilai rata-ratanya tidak terlalu besar (kalau mungkin nol).
Rumus persamaan regresi linier Y = a +bX bukan merupakan persamaan yang tepat, artinya persamaan tersebut merupakan pendekatan persamaan Y = a + bX. Persamaan yang sebenarnya terlalu sukar untuk dihitung (walaupun sebenarnya dapat dihitung dengan bantuan komputer yang canggih) sehingga hasil perhitungan a dan b yang merupakan pendekatan α dan β perlu diuji kecocokannya. Jika ternyata a berfungsi sebagai pengganti berfungsi sebagai pengganti β, maka persamaan di atas dapat digunakan sebagai pengganti persamaan sebenarnya, yang fungsinya untuk melakukan prediksi.
Nilai a dan nilai b dapat dihitung melalui rumus yang sederhana, sehingga tidak perlu ditakuti. Untuk memperoleh nilai a dapat digunakan rumus.

Sedangkan nilai b dapat dihitung dengan rumus 7.2.
Setelah nilai a dan b dapat dihitung, langkah selanjutnya adalah menguji apakah nilai a dan b memang dapat mewakili nilai α dan β. Untuk pengujian di sini kita perlu melihat beberapa variasi yang mungkin muncul, dan melihat apakah variasi-variasi tersebut terlalu besar atau tidak.
Beberapa variasi yang perlu dilihat adalah:
1.      Variasi kekeliruan taksiran (standard error estimate) yang dapat dihitung dengan rumus 7.3.
Rumus 7.3 menuntut perhitungan yang agak rumit karena faktor yang dikandung dalam rumus tersebut melibatkan simpangan masing-masing skor Y dengan nilai taksirannya ( ).
Mengingat kesukaran tersebut maka variasi kekeliruan taksiran dapat dihitung dengan rumus 7.4. yang lebih sederhana sbb.:
Untuk menghitung variasi X maupun variasi Y digunakan rumus 2.15. Di samping itu, variasi masing-masing variabel dapat dihitung dengan rumus 7..

Keterangan:
SS merupakan sum of squarres (jumlah kuadrat) yaitu jumlah kuadrat simpangan masing-masing nilai dengan rata-ratanya.
2.      Variasi koefisien regresi terdiri dari dua macam:
a.       Koefisian regresi dihitung dengan rumus 7.6.
b.      Koefisien regresi b dihitung dengan rumus 7.7.
3.      Variasi ramalan Y untuk setiap X:
a.       Rata-rata ramalan dihitung dengan rumus 7.8.
b.      Ramalan individu dihitung dengan rumus 7.9.
Contoh soal 58 di atas jika dihitung nilai a, b, dan variasinya sbb.:
Langkah pertama: membuat tabel penyebaran nilai menjadi sbb.:
X
Y
XY
120
100
14400
10000
12000
115
95
13225
9025
10925
110
85
12100
7225
9350
105
90
11025
8100
9450
105
85
11025
7225
8925
105
85
11025
7225
8925
100
80
10000
6400
8000
100
75
10000
5625
7500
95
80
9025
6400
7600
90
70
8100
4900
6300
1045
845
109925
72125
88975

Sedangkan selisih setiap nilai X dengan rata-ratanya:
X
120
104,5
15,5
240,25
115
104,5
10,5
110,25
110
104,5
5,5
30,25
105
104,5
0,5
0,25
105
104,5
0,5
0,25
105
104,5
0,5
0,25
100
104,5
-4,5
20,25
100
104,5
-4,5
20,25
95
104,5
-9,5
90,25
90
104,5
-14,5
210,25


0
722,5

Selain kita mencari selisih setiap nilai X dengan rata-ratanya, kita perlu membuat tabel selisih setiap nilai Y rata-ratanya. Hal ini disebabkan perhitungan-perhitungan selanjutnya akan banyak menggunakan jumlah kuadrat simpangan nilai X maupun Y dengan rata-ratanya. Selisih nilai Y dengan rata-ratanya.
Y
100
84,5
15,5
240,25
95
84,5
10,5
110,25
85
84,5
0,5
0,25
90
84,5
5,5
30,25
85
84,5
0,5
0,25
85
84,5
0,5
0,25
80
84,5
-4,5
20,25
75
84,5
-9,5
90,25
80
84,5
-4,5
20,25
70
84,5
-14,5
210,25


0
722,5

Berdasarkan kedua tabel di atas dapat dihitung a, b, serta variasi sbb.:
Sebelum kita menghitung rata-rata kuadrat penyimpangan sekitar regresi, kita perlu menghitung variasi masing-masing variabel sbb.:
80,27777778      =80,28
80,27777778      =80,28
Hasil perhitungan variasi masing-masing variabel kita masukkan dalam rumus rata-rata kuadrat penyimpanan sekitar regresi, sehingga hasilnya:
S2Y.X =     {(80,28 – (0,932 x 80,28)}
          =
 S2b    = S2Y .X / ∑ (X - 2
           = 12,20 : 722,5 = 0,016887967
           = 0,0087
S2a      = S2Y.X }
            = 12,20 (1/10 + 10920,25/722,5)
            = 19,6597301
            = 19,66
Variasi ramalan individu Y untuk X yang diketahui ( untuk X = 100) adalah :
S2Y     = S2Y.X {
          = 12,2 {(1/10 + (100 – 104,5)2 : 722,5}
          = 13,76193772 = 13,76
C.    Pengujian signifikan Koefisien Regresi
Mengingat koefisien regresi yang sangat mempengaruhi nilain taksiran adalah b, maka pengujian disini cukup hanya menguji signifikan koefisien regresi b. Walaupun demikian masih dimungkinkan untuk melakukan pengujian signifikan koefisien regresi a, sebagai penguasan peneliti. Pengujian kedua koefisien regresi ini mempunyai langkah yang sama.
Korelasi variabel X dengan variabel Y dapat pula dihitung dengan rumus.\
r  =
korelasi juga dapat dihitung dengan rumus.
r2 =  = 0,9212755356
jadi, r =  = 0,9598309932 = 0,96
Setelah kita dapat menghitung besarnya hubungan antara variabel bebas dan variabel terikat , maka langkah selanjutnya adalah melakukan penafsiran. Dalam melakukan penafsiran kita gunakan koefisien determinasinya yaitu kuadrat koefisien korelasi, pada contoh di atas koefisien determinasinya adalah 0,92. Ini berarti bahwa kira-kira 92% variasi pada Y dapat diterapkan oleh X, sedangkan sisanya yang 8% dari penyimpanan-penyimpanan nilai Y tidak dapat diterapkan oleh variabel X. Tentunya kondisi pada contoh soal ini sangat baik, tetapi jika kita masih ragu atas hasil perhitungan koefisien korelasi, maka harus dilakukan pengujian kesignifikansian koefisien korelasi tersebut (ingat ujian signifikansi korelasi). Dalam soal diatas koefisien korelasi ternyata signifikan.
Secara singkat langkah-langkah dalam perhitungan regresi linier sederhana adalah:
1)      Meghitung nilai a dan b untuk menentukan persamaan regresi linier sederhana.
2)      Menguji signifikan koefisien regresi
3)      Menghitung variasi untuk selanjutnya digunakan untuk menentukan standard error penafsiran
4)      Menentukan confidence dari penafsiran
5)      Menghitung koefisien korelasi, untuk menghitung koefisien determinasi
6)      Menguji signifikansi daripada koefisien korelasi
7)      Melakukan interprestasi
Langkah lain untuk menguji hipotesis berkaitan dengan regresi linier adalah melalui analisis variasi. Dalam hal ini kita akan berhubungan dengan jumlah kuadrat (sum of squares) dari masing-masing variabel. Disini jumlah kuadrat variabel terikat merupakan juml;ah dari kuadrat: kuadrat jumlah Y dibagi dnegan jumlah hasil kali simpangan masing-masing variabel dengan rata-ratanya, dan juml;ah kuadrat simpangan Y dengan ý.
Dengan demikian maka sumber variasi terdiri dari 3 macam, yaitu:
1)      Regresi a, dengan derajat kebebasan 1.
2)      Regresi (b/a), dengan derajat kebebasan 1.
3)      Sisa, dengan derajat kebebasan n-2.
Dari ketiga sumber variasi di atas kita dapat menghitung dari masing-masingnya berupa sum of squares. Sum of squares yang berkaitan dengan regresi a dapat dihitung dengan rumus.
SSa = (∑Y)2 / n
Untuk contoh diataas SSa adalah:
= 714025 : 10
= 71402,5
sum of squares yang berkaitan dengan regresi b/a dapat dihitung dengan rumus.
SSb/a = b{∑XY-
Untuk contoh nilai SSb/a adalah:
= 0,93 [88975-{(1045 x 845) : 10}]
=625,425
Sum of squares sisa dapat dihitung dengan rumus.
SSsisa = ∑Y2 – SSa – SSb/a
Untuk contoh diatas, nilai SSsisanya adalah:
72125 – 71402,5 – 625,425
=97,075
Mean squares yang berkaitan dengan regresi a dapat dihitung dengan rumus.
MSa = SSa / dk SSa
Untuk contoh diatas mean squares nya adalah:
=71402,5 : 1
=71402,5
Mean squares yang berkaoitan dengan regresi b/a dapat dihitung dengan rumus.
MSb/a = SSb/a / dk SSb/a
                = 625,425 : 1
            =625,425
Mean squares yang berkaitan dengan regresi sisa dihitung dengan rumus.
MSsisa = SSsisa / dk SSsisa
            =97,075 : 8
            =12,134375
Tahap akhir dalam pengujian hipotesis signifikansi kontribusi atau sumbangan variabel X terdapat variabel Y adalah menghitung variabel F yang dapat diperoleh dengan rumus.
F          = MSb/a : MSsisa
            =625,425 : 12,134375
            =51,54159155 = 51,54
Setelah nilai F hitung diperoleh, maka kita akan menerima atau menolak H0 dengan jalan membandingkan nilai F hitung dengan  nilai F tabel.
Langkah-langkah tersebut akan menghasilkan analisis yang baik jika beberapa syarat telah terpenuhi. Oleh karena itu, sebelum kita beranjak lebih baik kita menguji apakah kondisi data sampel kita telah memenuhi seluruh persyaratan analisis regresi atau tidak. sedangkan syarat-syarat yang harus dipenuhi dalam perhitungan diatas adalah:
1)      Sampel diambil secara random (acak).
2)      Variabel X dan variabel Y mempunyai hubungan yang kausal, dimana X merupakan sebab dan Y merupakan akibat.
3)      Nilai Y mempunyai penyebaran yang berdistribusi normal.
4)      Persamaan tersebut hendaknya benar-benar linier.
D.    Uji Linier Regresi Sederhana
     Pada pembahasan yang lalu kita tidak secara teliti dan terperinci membahas tentang linieritas dari persamaan regresi yang kita peroleh. pada saat pengujian signifikansi koefisien regresi soal no. 58 telah kita simpulkan bahwa koefisien regresi adalah signifikan dan linier. Untuk lebih telitinya analisis, masih perlu dilakukan analisis terpisah tentang apakah persamaan regresi yang diperoleh itu linier atau tidak. jika ternyata persamaan linier barulah bisa digunakan untuk melakukan prediksi dengan bentuk linier, sebaliknya jika ternyata persamaan yang di peroleh tidak linier, maka kita perlu menggunakan persamaan lain yang lebih cocok. Pada pembahasan yang lalu pun telah disinggung selintas pengujian linieritas dengan “least squares”. Jika jumlah data tidak banyak, least squares memang bisa membantu peneliti untuk melihat bentuk persamaan. Tetapi, jika jumlah sumpel yang dihadapi banyak, maka pengamatan melalui least squares bisa menyesatkan. Di samping itu, least squares tergantung pada pengamatan mata semata. Untuk itulah least squares perlu disertai dengan bentuk pengujian linearitas.
     Pengujian linearitas berkaitan dengan sum of squares sisa, dimana sum squares sisa dipisah menjadi dua bagian yaitu sum of squares ketidaksamaan, dan sum of squares error. Dalam membahas ketidaksamaan kita perlu melihat (mengelompokkan) Y berdasarkan nilai X, artinya kita cari simpangan nilai Y dalam setiap kelompok X . sehingga banyaknya derajat kebebasannya adalah k (banyak kelompok X) dikurang dengan 2. Sedangkan sum of squares error merupakan selisih sumof squares sisa dengan sum of squares ketidaksamaan, dengan derajat kebebasan n-k.
     Untuk lebih jelasnya marilah kita uji linearitas contoh soal No. 58 dimuka.
Langkah adalah menyusun penyebaran nilai-nilai data Y berdasarkan nilai X.
Penyebaran nilai pengamatan Y berdasarkan nilai X untuk soal no. 58 sebagai berikut:
X
Y
120
100
115
95
110
85
105
90
105
85
105
85
100
80
100
75
95
80
90
70
Berdasarkan tabel di atas dapat dihitung sum of squares error (SSerror) dengan rumus sebagai berikut:
SSerror = xk(Y2
Keterangan:
xk  merupakan jumlah simpangan setiap Y yang didasarkan pada pengelompokan (persamaan nilain )X
nk merupakan jumlah n di setiap kelompok
untuk contoh soal No. 58 di atas squares ketidaksamaannya sebagai berikut:
SSerror = (1002 - ) + (952 - ) + (852 - ) + (902 + 852 + 852 ) +                   (802+752 ) + (802 - ) + (702 - ) = 0 + 0 + 0 +16,667 + 12,5 +0 +0 = 29,167
SSketidaksamaan = SSsisa - SSerror
                        = 97,075 – 29,167
                        = 67,908
MSketidaksamaaan= SSketidaksamaan : dk SSketidaksamaan
                        =67,908 : (7-2)
                        =13,5816
MSerror              =SSerror : dk SSerror
                        =29,167 : (10-7))                    
                        =9,722333333
                        =9,7223
Untuk linieritas kita akan menggunakan F tes, sedangkan hipotesisnya sebagai berikut:
H0 : persamaan regresi linier
H1 : persamaan regresi tak linier
Sedangkan F hitung dicari dengan rumus
F = MSketidaksamaaan : MSerror       
Untuk soal No. 58 di atas F hitungnya adalah:
F          = 13,5816 : 9,7233
            =1,396809725 = 1,40
Jika mengambil alpha (α) 0,05, maka F0,05(5,3)=9,01 (lihat tabel F).
Oleh karena F hitung lebih kecil daripada F tabel maka kita akan menerima Hipotesis yang mengatakan bahwa persamaan regresi yang diperoleh yaitu ý = -12,77 + 0,93 X merupakan persamaan regresi linier. Dengan demikian kita tidak perlu mencari model persamaan lain, sebaliknya apabila kita ternyata persamaan regresi yang diperoleh tidak linier, maka kita harus mencari persamaan model lain.



Jika kita digabungkan hasil analisis variance tentang signifikansi koefisien regresi dan linieritas persamaan regresi, maka tabel anovanya sebagai berikut:
sumber variansi
dk
SS
MS
F
total
10
72125


regresi a
1
71402,5
71402,5

regresi b/a
1
625,425
625,425
51,54
sisa
8
97,075
12,13438

ketidaksamaan
5
67,908
13,5816
1,4
error
3
29,167
9,7223


Catatan: uji linieritas mempunyai kriteria penerimaan hipotesis nol terbaik dengan kriteria yang lainnya.


           







DAFTAR PUSTAKA
Indrianto, Agus. Statistik Dasar Aplikasi dan Pengembangannya. Jakarta : prenada media group. 2010.