Selasa, 01 Januari 2019

Analisis Komponen Utama (AKU)

Analisis Komponen Utama (AKU)

Analisis Komponen Utama atau Principal Component Analysis (PCA) merupakan analisis statistika multivariate interdependen yang bertujuan mereduksi dimensi data dengan cara membangkitkan variabel baru (komponen utama) yang merupakan kombinasi linear dari variabel asal sedemikan hingga varians komponen utama menjadi maksimum dan antar komponen utama bersifat  saling bebas. Analisis Komponen Utama hanya bisa dilakukan jika variabel-variabelnya berskala interval dan rasio. Analisis komponen utama dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan.[2]

Reduksi dimensi adalah bagian penting bagi prosedur menganalisis data berdimensi tinggi. PCA linier untuk mereduksi dimensi. PCA linier yang seringkali dikenal analisis EOF empirical orthogonal function adalah teknik yang sangat kuat untuk tujuan kerakterisasi dan mereduksi dimensi data yang memiliki struktur data linier dan berdimensi rendah.



Permodelan dari analisis ini adalah




dengan prinsip dasar:



maks var(Yi) dan corr(Yi, Yj)=0



Prinsip dasar dari analisis ini adalah penyederhanaan suatu data, dengan mentransformasi data secara linier sehingga terbentuk sistem koordinat baru dengan varians maksimum.[1] PCA merupakan analisis antara dari suatu proses penelitian yang besar yang merupakan  awalan dari analisis berikutnya. PCA  biasanya memberikan masukan bagi analisis lanjutan seperti regresi berganda atau analisis faktor atau analisis gerombol. Analisis komponen utama juga sering digunakan untuk menghindari masalah multikolinearitas antar peubah bebas dalam model regresi berganda.[3][4]


Analisis Komponen Utama (PCA) dibatasi oleh asumsi [7]:
1. asumsi kelinearan model regresi,
2. asumsi keorthogonalan komponen utama yaitu sumbu dari setiap principal component harus saling
    tegak lurus satu sama lain (Orthogonal Vectors), dan 
3. asumsi varians yang besar memiliki struktur yang penting sehingga informasi yang dihasilkan
    dapat lebih terjaga(sesuai)


Komponen Utama  (KU) merupakan kombinasi linear dari peubah yang diamati. Informasi yang terkandung pada KU merupakan gabungan dari semua peubah dengan bobot tertentu. Kombinasi linear yang dipilih merupakan kombinasi linear dengan ragam paling besar karena memuat informasi paling banyak. Antar KU bersifat ortogonal tidak berkorelasi informasi tidak tumpang tindih. Komponen Utama atau Principal Components (PC) dapat ditemukan dengan cara melakukan Eigenvalue Decomposition dari Matiks Kovarians (Covariance Matrix) atau Matriks Korelasi (correlation matrix) dari suatu data atau menggunakan metode Singular Value Decomposition (SVD). 


Tahapan Mencari Komponen Utama (Principal Component) dari Suatu Data:

1. Transformasi Mean-Centering
    Pada tahapan ini semua data dipindahkan ke bagian tengah. Pemindahan ini dilakukan untuk 
    mendapatkan data yang lebih stabil.
    Berikut langkah-langkah mean-centering:
    a. Cari nilai rata-rata (mean) data
    b. Pindahkan setiap posisi data ke bagian tengah, dengan cara mengurangi nilai setiap data dengan
         nilai mean data 

2. Menghitung Covariance-Matrix
    Covariance-Matrix merupakan matriks yang berisi seluruh pasangan covariance dari semua 
    himpunan varians data yang ada. Secara umum, berikut bentuk matrixnya: 

3. Mencari Eigenvalue dan Eigenvector dari Covariance-Matrix (Principal Component)
   Eigenvector dari suatu matriks A (berukuran n x n) adalah suatu vektor v, yang jika dikalikan 
  dengan matriks A menghasilkan kelipatan dari vektor v tersebut. Nilai kelipatan tersebut merupakan
  Eigenvalue. 

4. Urutkan principal components tersebut secara menurun 

5. Transformasi Data ke Sumbu Principal Components
    Untuk mentransformasi data ke sumbu principal components yang ada, cukup mengalikan data 
    tersebut dengan invers dari principal components yang telah didapat sebelumnya. 



Gambaran Analisis Komponen Utama

Gugus peubah asal {X1, X2, ..., Xp} ditransformasi menjadi Gugus KU {KU1, KU2, ..., KUp}

"Hanya dipilih k < p KU saja, namun mampu memuat sebagian besar informasi"



Bentuk Komponen Utama

KU1= a1x= a11x1+ ... + a1pxp

Jika gugus peubah asal {X1, X2, ..., Xp} memiliki matriks ragam peragam S maka ragam dari komponen utama adalah
= a1Sa1=
Tugas kita adalah bagaimana mendapatkan vektor a1 sehingga ragam di atas maksimum (vektor ini disebut vektor koefisien)






 

Referensi

  1. ^ A. A. Miranda, Y. A. Le Borgne, and G. Bontempi. New Routes from Minimal Approximation Error to Principal Components, Volume 27, Number 3 / June, 2008, Neural Processing Letters, Springer
  2. ^ a b Johnson, Richard A & Wichern, Dean W. Applied Multivariate Statistical Analysis (New Jersey: Prentice-Hall International Inc, 1998). ISBN 0-13-080084-8.
  3. ^ Juanda, Bambang. Ekonometrika : Pemodelan dan Pendugaan (Bogor: IPB Press, 2009). ISBN 978-979-493-177-6.
  4. ^ Iriawan, Nur , Astuti, Septin Puji. Mengolah Data Statistik dengan mudah menggunakan Minitab 14 (Yogyakarta: ANDI, 2006). ISBN 979-763-111-7.
  5. ^ a b c Draper, Norman & Smith, Harry. Analisis Regresi Terapan (Jakarta: PT Gramedia Pustaka Utama, 1992). ISBN 979-511-146-9.
  6. ^ Harvey Mudd College (3 November 2009). Karhunen-Loeve Transform (KLT) (html) (dalam bahasa Inggris). Siaran pers. Diakses pada 10 Mei 2010.
  7. ^ a b Jonathon Shlens, A Tutorial on Principal Component Analysis.




Tidak ada komentar:

Posting Komentar