Analisis Komponen Utama atau Principal Component Analysis (PCA) merupakan analisis statistika multivariate interdependen yang bertujuan mereduksi dimensi data
dengan cara membangkitkan variabel baru (komponen utama) yang merupakan
kombinasi linear dari variabel asal sedemikan hingga varians komponen utama
menjadi maksimum dan antar komponen utama bersifat saling bebas. Analisis Komponen Utama hanya bisa dilakukan jika variabel-variabelnya berskala interval dan rasio. Analisis komponen utama dapat digunakan untuk mereduksi dimensi suatu
data tanpa mengurangi karakteristik data tersebut secara signifikan.[2]
Reduksi dimensi adalah bagian penting bagi prosedur menganalisis data berdimensi tinggi. PCA linier untuk mereduksi dimensi. PCA linier yang
seringkali dikenal analisis EOF empirical orthogonal function adalah
teknik yang sangat kuat untuk tujuan kerakterisasi dan mereduksi dimensi
data yang memiliki struktur data linier dan berdimensi rendah.
Permodelan dari analisis ini adalah
dengan prinsip dasar:
maks var(Yi) dan corr(Yi,
Yj)=0
Prinsip dasar dari analisis ini adalah penyederhanaan suatu data, dengan mentransformasi data secara linier sehingga terbentuk sistem koordinat baru dengan varians maksimum.[1] PCA merupakan analisis antara dari suatu proses
penelitian yang besar yang merupakan awalan dari analisis berikutnya. PCA biasanya memberikan masukan bagi analisis lanjutan seperti regresi berganda atau analisis faktor atau analisis gerombol. Analisis komponen utama juga sering digunakan untuk menghindari masalah multikolinearitas antar peubah bebas dalam model regresi berganda.[3][4]
Analisis Komponen Utama (PCA) dibatasi oleh asumsi [7]:
1. asumsi kelinearan model regresi,
2. asumsi keorthogonalan komponen utama yaitu sumbu dari setiap principal component harus
saling
tegak lurus satu sama lain (Orthogonal Vectors), dan
tegak lurus satu sama lain (Orthogonal Vectors), dan
3. asumsi varians yang besar memiliki struktur yang penting sehingga informasi yang
dihasilkan
dapat lebih terjaga(sesuai).
Tahapan Mencari Komponen Utama (Principal Component) dari Suatu Data:
1. Transformasi Mean-Centering
Pada tahapan ini semua data dipindahkan ke bagian tengah. Pemindahan ini dilakukan untuk
mendapatkan data yang lebih stabil.
Berikut langkah-langkah mean-centering:
a. Cari nilai rata-rata (mean) data
b. Pindahkan setiap posisi data ke bagian tengah, dengan cara mengurangi nilai setiap data dengan
nilai mean data
2. Menghitung Covariance-Matrix
Covariance-Matrix merupakan matriks yang berisi seluruh pasangan covariance dari semua
himpunan varians data yang ada. Secara umum, berikut bentuk matrixnya:
3. Mencari Eigenvalue dan Eigenvector dari Covariance-Matrix (Principal Component)
Eigenvector dari suatu matriks A (berukuran n x n) adalah suatu vektor v, yang jika dikalikan
dengan matriks A menghasilkan kelipatan dari vektor v tersebut. Nilai kelipatan tersebut merupakan
Eigenvalue.
4. Urutkan principal components tersebut secara menurun
5. Transformasi Data ke Sumbu Principal Components
Untuk mentransformasi data ke sumbu principal components yang ada, cukup mengalikan data
tersebut dengan invers dari principal components yang telah didapat sebelumnya.
dapat lebih terjaga(sesuai).
Komponen
Utama (KU) merupakan kombinasi linear
dari peubah yang diamati. Informasi yang terkandung pada KU merupakan gabungan
dari semua peubah dengan bobot tertentu. Kombinasi linear yang dipilih
merupakan kombinasi linear dengan ragam paling besar karena memuat informasi
paling banyak. Antar KU bersifat ortogonal tidak berkorelasi informasi tidak
tumpang tindih. Komponen Utama atau Principal Components (PC) dapat ditemukan dengan cara melakukan
Eigenvalue Decomposition dari Matiks Kovarians (Covariance Matrix) atau Matriks Korelasi (correlation
matrix) dari suatu data atau menggunakan metode Singular Value
Decomposition (SVD).
Tahapan Mencari Komponen Utama (Principal Component) dari Suatu Data:
1. Transformasi Mean-Centering
Pada tahapan ini semua data dipindahkan ke bagian tengah. Pemindahan ini dilakukan untuk
mendapatkan data yang lebih stabil.
Berikut langkah-langkah mean-centering:
a. Cari nilai rata-rata (mean) data
b. Pindahkan setiap posisi data ke bagian tengah, dengan cara mengurangi nilai setiap data dengan
nilai mean data
2. Menghitung Covariance-Matrix
Covariance-Matrix merupakan matriks yang berisi seluruh pasangan covariance dari semua
himpunan varians data yang ada. Secara umum, berikut bentuk matrixnya:
3. Mencari Eigenvalue dan Eigenvector dari Covariance-Matrix (Principal Component)
Eigenvector dari suatu matriks A (berukuran n x n) adalah suatu vektor v, yang jika dikalikan
dengan matriks A menghasilkan kelipatan dari vektor v tersebut. Nilai kelipatan tersebut merupakan
Eigenvalue.
4. Urutkan principal components tersebut secara menurun
5. Transformasi Data ke Sumbu Principal Components
Untuk mentransformasi data ke sumbu principal components yang ada, cukup mengalikan data
tersebut dengan invers dari principal components yang telah didapat sebelumnya.
Gambaran Analisis
Komponen Utama
Gugus peubah
asal {X1, X2, ..., Xp} ditransformasi menjadi Gugus KU {KU1, KU2, ..., KUp}
"Hanya
dipilih k < p KU saja,
namun mampu memuat sebagian
besar informasi"
Bentuk
Komponen Utama
KU1=
a1x= a11x1+ ... + a1pxp
Jika gugus
peubah asal {X1, X2, ..., Xp} memiliki matriks
ragam peragam S maka ragam dari komponen utama adalah
= a1’Sa1=
Tugas kita adalah bagaimana mendapatkan vektor a1
sehingga ragam di atas maksimum (vektor ini disebut vektor koefisien)Referensi
- ^ A. A. Miranda, Y. A. Le Borgne, and G. Bontempi. New Routes from Minimal Approximation Error to Principal Components, Volume 27, Number 3 / June, 2008, Neural Processing Letters, Springer
- ^ a b Johnson, Richard A & Wichern, Dean W. Applied Multivariate Statistical Analysis (New Jersey: Prentice-Hall International Inc, 1998). ISBN 0-13-080084-8.
- ^ Juanda, Bambang. Ekonometrika : Pemodelan dan Pendugaan (Bogor: IPB Press, 2009). ISBN 978-979-493-177-6.
- ^ Iriawan, Nur , Astuti, Septin Puji. Mengolah Data Statistik dengan mudah menggunakan Minitab 14 (Yogyakarta: ANDI, 2006). ISBN 979-763-111-7.
- ^ a b c Draper, Norman & Smith, Harry. Analisis Regresi Terapan (Jakarta: PT Gramedia Pustaka Utama, 1992). ISBN 979-511-146-9.
- ^ Harvey Mudd College (3 November 2009). Karhunen-Loeve Transform (KLT) (html) (dalam bahasa Inggris). Siaran pers. Diakses pada 10 Mei 2010.
- ^ a b Jonathon Shlens, A Tutorial on Principal Component Analysis.
Tidak ada komentar:
Posting Komentar