Komputasi Numeris: Analisis Regresi Sederhana Linear
Pendahuluan:
Persamaan regresi adalah sebuah persamaan matematik
(biasanya terdiri minimal 2 variabel) yang digunakan untuk menentukan hubungan
2 variabel tersebut. Variabel tersebut berupa variabel yang diamati (dependen:
baca dipengaruhi) terhadap variabel pengaruh (independen: baca mempengaruhi).
Seringkali data yang kita peroleh merupakan data experimental yang bersifat
diskrit misalnya:
- Arus listrik terhadap tegangan
- Ukuran file terhadap waktu pengiriman (upload atau download)
- Besarnya gaya dengan tekanan
- Jumlah karyawan terhadap waktu pengerjaan proyek.
- dsb
Yang kita harapkan dari hubungan data-data tersebut adalah:
- Membentuk kurva yang dapat “mewakili” hubungan mereka yang disebut sebagai kurva fitting.
- Mengestimasi (memprediksi) nilai pada titik-titik yang tidak diketahui.
Contoh:
Kita memiliki data lama pengerjaan proyek dengan dua
variabel yaitu jumlah karyawan terhadap waktu pengerjaan sebagai berikut:
Grafik perbandingan kedua variabel tersebut adalah sebagai
berikut:
Dari
data tersebut, kita mungkin ingin tahu, hubungan antara jumlah karyawan dengan
waktu pengerjaan. Untuk saat ini, kita hanya tahu bahwa: “Semakin banyak
karyawan, waktu pengerjaan akan semakin cepat” atau dengan kata lain "Jika ingin pekerjaannya diselesaikan lebih cepat, maka tambahlah karyawan".
Hal ini didasarkan pada tren
data atau grafik tersebut. Tetapi hanya itu. kita tidak bisa menjawab pertanyaan berikut:
- Jika saya ingin mengerjakan proyek dalam 25 hari, berapa karyawan yang saya harus rekrut?
- Berapa karyawan maksimum yang bisa saya rekrut? Jika melihat pada contoh grafik di atas, setelah 15 karyawan, perubahan waktu pengerjaan tidak lagi signifikan (tidak banyak berubah di sekitar angka 18 hari).
- Berapa waktu tercepat pengerjaan proyek? Kecuali kita bukan Bandung Bondowoso yang dapat mengerjakan sebuah perkerjaan dalam satu malam
Pertanyaan-pertanyaan tersebut
dapat kita selesaikan dengan persamaan regresi sederhana yang hanya melibatkan
2 variabel (dependen dan independen). Untuk variabel yang lebih komplek,
disarankan menggunakan analisis regresi berganda.
Pada kesempatan ini, kita akan membahas analisis
regresi linear. Untuk analisis regresi non linear akan kita bahas berikutnya.
Dasar Teori:
Secara prinsip, terdapat 2 metode pendekatan
dalam membangun kurva fitting:
- Regresi (nantinya disebut sebagai regresi kuadrat terkecil atau least square method)
- Interpolasi
Metode regresi (yang akan kita
pelajari) dibuat dengan merepresentasikan tren data secara umum. Kurva yang
terbentuk tidak harus melewati titik-titik data diskrit. Perhatikan gambar
berikut:
Sedangkan interpolasi adalah metode pendekatan yang dilakukan dengan membuat kurva yang melalui setiap titik. Perhatikan contoh berikut:
Regresi Kuadrat Terkecil
Sebelum kita masuk pada bagaimana membuat kurva fitting, kita pahami dulu pengertian menggunakan Least Square Method. Least Square Method adalah metode pengkuadratan kesalahan terkecil.Disini kita akan mencari terlebih dulu nilai kuadrat terkecilnya kemudian nilai tersebut dikuadratkan sehingga diharapkan nilai kesalahannya akan sangat kecil.
Mencari titik terkecil atau terbesar dari sebuah persamaan, secara gampang dapat dilakukan dengan mencari akar persamaan dari persamaan turunannya. Sebagai contoh, sebuah persamaan kuadrat:
memiliki
titik puncak parabola di x=0.5. Diperoleh dari f'(x) = 2x - 1 = 0
Karena nilai ekstrim error dapat
dicari menggunakan turunan dari persamaan tersebut, maka least square method untuk
regresi linear dapat kita algoritmakan sebagai berikut:
1. Asumsikan sistem persamaan linear
yang akan kita selesaikan adalah y = a +
bx
2. Error atau kesalahannya dan kuadrat error-nya adalah:
3. Jumlah kuadrat kesalahannya:
4. Cari nilai terbaik untuk a dan b atau dengan kata lain akan dibentuk kurva fitting dengan error terkecil dengan cara mencari akar persamaan turunannya.
5. Berikut adalah proses mencari nilai a dan b terbaik:
5. Berikut adalah proses mencari nilai a dan b terbaik:
6. Proses mencari nilai b:
Substitusikan persamaan (1) terhadap persamaan (2):
Maka nilai b adalah:
sedangkan nilai a adalah persamaan (1)
7. Selesai.
Studi Kasus
Setelah kita peroleh formula untuk mencari nilai a dan b terbaik, saatnya kita implementasikan dalam sebuah kasus. Sedikit berbeda dengan pendahuluan yang sebaiknya menggunakan analisis regresi non linear, contoh yang akan kita selesaikan adalah sebagai berikut:
Dari contoh di atas, diketahui jumlah data (n) adalah 8.
Saat-nya kita kumpulkan variabel-variabel yang dibutuhkan untuk mencari a dan b. Perhatikan tabel excel berikut:
maka
Untuk nilai a:
Sehingga persamaan regresi linearnya adalah y = 0.545455 + 0.6363636 x
Pembuktian
Untuk melihat apakah persamaan kita benar atau tidak, kita dapat menggunakan trendline di excel (tutorial dapat dibaca di sini) seperti pada gambar berikut:
Selamat mencoba
hallo selamat siang mas, mau bertanya mengenai analisis regresi, jika teknik analisis data dalam penelitian saya regresi sederhana tapi ketika di uji normalitas dan linieritasnya ternyata datanya normal tapi tidak linier, untuk uji hipotesis apakah harus menggunakan anlisis regresi non parametrik? lalu harus di uji menggunakan metode apa mas jika menggunakan non parametrik tersebut? terimakasih sebelumnya 🙏🙏🙏