Komputasi Numeris: Analisis Regresi Sederhana Linear



Pendahuluan:

Persamaan regresi adalah sebuah persamaan matematik (biasanya terdiri minimal 2 variabel) yang digunakan untuk menentukan hubungan 2 variabel tersebut. Variabel tersebut berupa variabel yang diamati (dependen: baca dipengaruhi) terhadap variabel pengaruh (independen: baca mempengaruhi). Seringkali data yang kita peroleh merupakan data experimental yang bersifat diskrit misalnya:
  1. Arus listrik terhadap tegangan
  2. Ukuran file terhadap waktu pengiriman (upload atau download)
  3. Besarnya gaya dengan tekanan
  4. Jumlah karyawan terhadap waktu pengerjaan proyek.
  5. dsb

Yang kita harapkan dari hubungan data-data tersebut adalah:

  1. Membentuk kurva yang dapat “mewakili” hubungan mereka yang disebut sebagai kurva fitting.  
  2. Mengestimasi (memprediksi) nilai pada titik-titik yang tidak diketahui.

Contoh:

Kita memiliki data lama pengerjaan proyek dengan dua variabel yaitu jumlah karyawan terhadap waktu pengerjaan sebagai berikut:
Grafik perbandingan kedua variabel tersebut adalah sebagai berikut:


Dari data tersebut, kita mungkin ingin tahu, hubungan antara jumlah karyawan dengan waktu pengerjaan. Untuk saat ini, kita hanya tahu bahwa: “Semakin banyak karyawan, waktu pengerjaan akan semakin cepat” atau dengan kata lain "Jika ingin pekerjaannya diselesaikan lebih cepat, maka tambahlah karyawan". 
Hal ini didasarkan pada tren data atau grafik tersebut. Tetapi hanya itu. kita tidak bisa menjawab pertanyaan berikut:
  1. Jika saya ingin mengerjakan proyek dalam 25 hari, berapa karyawan yang saya harus rekrut?
  2. Berapa karyawan maksimum yang bisa saya rekrut? Jika melihat pada contoh grafik di atas, setelah 15 karyawan, perubahan waktu pengerjaan tidak lagi signifikan (tidak banyak berubah di sekitar angka 18 hari).
  3. Berapa waktu tercepat pengerjaan proyek? Kecuali kita bukan Bandung Bondowoso yang dapat mengerjakan sebuah perkerjaan dalam satu malam
Pertanyaan-pertanyaan tersebut dapat kita selesaikan dengan persamaan regresi sederhana yang hanya melibatkan 2 variabel (dependen dan independen). Untuk variabel yang lebih komplek, disarankan menggunakan analisis regresi berganda. Pada kesempatan ini, kita akan membahas analisis regresi linear. Untuk analisis regresi non linear akan kita bahas berikutnya.

Dasar Teori: 

Secara prinsip, terdapat 2 metode pendekatan dalam membangun kurva fitting:  
  1. Regresi (nantinya disebut sebagai regresi kuadrat terkecil atau least square method
  2. Interpolasi  
Metode regresi (yang akan kita pelajari) dibuat dengan merepresentasikan tren data secara umum. Kurva yang terbentuk tidak harus melewati titik-titik data diskrit. Perhatikan gambar berikut:

Sedangkan interpolasi adalah metode pendekatan yang dilakukan dengan membuat kurva yang melalui setiap titik. Perhatikan contoh berikut:


Regresi Kuadrat Terkecil
 
Sebelum kita masuk pada bagaimana membuat kurva fitting, kita pahami dulu pengertian menggunakan Least Square Method. Least Square Method adalah metode pengkuadratan kesalahan terkecil.Disini kita akan mencari terlebih dulu nilai kuadrat terkecilnya kemudian nilai tersebut dikuadratkan sehingga diharapkan nilai kesalahannya akan sangat kecil.
Mencari titik terkecil atau terbesar dari sebuah persamaan, secara gampang dapat dilakukan dengan mencari akar persamaan dari persamaan turunannya. Sebagai contoh, sebuah persamaan kuadrat:

memiliki titik puncak parabola di x=0.5. Diperoleh dari f'(x) = 2x - 1 = 0

Karena nilai ekstrim error dapat dicari menggunakan turunan dari persamaan tersebut, maka least square method untuk regresi linear dapat kita algoritmakan sebagai berikut:

1. Asumsikan sistem persamaan linear yang akan kita selesaikan adalah  y = a + bx
2. Error atau kesalahannya dan kuadrat error-nya adalah:
 

3. Jumlah kuadrat kesalahannya:
       
4. Cari nilai terbaik untuk a dan b atau dengan kata lain akan dibentuk kurva fitting dengan error terkecil dengan cara mencari akar persamaan turunannya.
5. Berikut adalah proses mencari nilai a dan b terbaik:
6. Proses mencari nilai b:
Substitusikan  persamaan (1) terhadap persamaan (2):


Maka nilai b adalah:

sedangkan nilai a adalah persamaan (1)

7. Selesai.


Studi Kasus
Setelah kita peroleh formula untuk mencari nilai a dan b terbaik, saatnya kita implementasikan dalam sebuah kasus. Sedikit berbeda dengan pendahuluan yang sebaiknya menggunakan analisis regresi non linear, contoh yang akan kita selesaikan adalah sebagai berikut:

Dari contoh di atas, diketahui jumlah data (n) adalah 8.
Saat-nya kita kumpulkan variabel-variabel yang dibutuhkan untuk mencari a dan b. Perhatikan tabel excel berikut:

maka

Untuk nilai a:

Sehingga persamaan regresi linearnya adalah y = 0.545455 + 0.6363636 x

Pembuktian

Untuk melihat apakah persamaan kita benar atau tidak, kita dapat menggunakan trendline di excel (tutorial dapat dibaca di sini) seperti pada gambar berikut:

Selamat mencoba
 

Next Post Previous Post
1 Comments
  • salabarfaiz
    salabarfaiz December 6, 2020 at 11:15 PM

    hallo selamat siang mas, mau bertanya mengenai analisis regresi, jika teknik analisis data dalam penelitian saya regresi sederhana tapi ketika di uji normalitas dan linieritasnya ternyata datanya normal tapi tidak linier, untuk uji hipotesis apakah harus menggunakan anlisis regresi non parametrik? lalu harus di uji menggunakan metode apa mas jika menggunakan non parametrik tersebut? terimakasih sebelumnya 🙏🙏🙏

Add Comment
comment url