CLUSTER ANALYSIS

CLUSTER ANALYSIS

 CHAPTER I

A. Definisi
Analisis Cluster termasuk dalam teknik analisis multivariate metode interdependen. Teknik ini bertujuan untuk mengatur informasi / meringkas data dengan cara mengelompokkan objek-objek berdasarkan kesamaan karakteristik tertentu. Dengan demikian, Cluster analisis atau clustering memiliki tujuan untuk mengelompokkan data dari serangkaian pengamatan ke subset (disebut cluster).

B. Sejarah Singkat

Analisis cluster panjang (pertama kali digunakan oleh Tryon, 1939) meliputi beberapa algoritma yang berbeda dan metode untuk mengelompokkan benda serupa ke dalam kategori masing-masing. Sebuah pertanyaan umum yang dihadapi peneliti di banyak bidang penelitian adalah bagaimana mengorganisasi data yang diamati ke dalam struktur yang bermakna, yaitu, untuk mengembangkan taksonomi.Analisis cluster dapat digunakan untuk menemukan struktur data tanpa memberikan penjelasan / penafsiran. Dengan kata lain, analisis cluster hanya menemukan struktur data tanpa menjelaskan mengapa mereka ada. (ref 1)

C. Cara Kerja Analisisi Cluster

Tujuan utama analisis cluster adalah menentukan struktur data dengan cara meletakkan observasi yang mirip dalam satu kelompok. Pengelompokan hasil observasi yang mirip ke dalam satu kelompok didasarkan pada korelasi antar objek atau dapat juga dengan mengukur proximity pada ruang dua dimensi sehingga jarak antara dua observasi menunjukkan kesamaan. Langkah berikutnya adalah menentukan bagaimana membentuk cluster dan berapa jumlah cluster yang akan dibentuk (Imam Ghozali, 2009 : 312)

D. Metode Analisis Cluster (ref 1)

Single linkage (tetangga terdekat). Dalam metode ini jarak antara dua cluster ditentukan oleh jarak dari dua obyek terdekat (tetangga terdekat) dalam cluster yang berbeda.

Complete linkage (furthest neighbor). Dalam metode ini, jarak antara cluster ditentukan oleh jarak terbesar antara dua obyek dalam cluster yang berbeda (yaitu, oleh “tetangga jauh”). Metode ini biasanya melakukan cukup baik dalam kasus-kasus ketika obyek benar-benar terbentuk secara alami berbeda. Jika cluster cenderung memanjang entah bagaimana atau yang bersifat tipe “rantai”, maka metode ini adalah kurang baik dilakukan.

Unweighted pair-group average. Dalam metode ini, jarak antara dua cluster dihitung sebagai jarak rata-rata antara semua pasangan obyek dalam dua kelompok yang berbeda. Metode ini juga sangat efisien ketika objek bentuk alami yang berbeda.

Weighted pair-group average. Metode ini identik dengan metode rata-rata kelompok pasangan unweighted, kecuali bahwa dalam perhitungan, ukuran cluster masing-masing (yaitu, jumlah objek yang terkandung di dalamnya) digunakan sebagai pemberat. Sneath dan Sokal (1973) memperkenalkan WPGMA untuk menyebut metode ini sebagai pasangan kelompok tertimbang metode menggunakan rata-rata aritmatika.

E. Analisis Cluster dalam beberapa bidang keilmuan

Dalam analisis Pemasaran, Cluster analysis dapat digunakan untuk (a) mengetahui segmentasi dan menentukan target pasar yang dituju; (b) mengetahui positioning produk dan menentukan pengembangan produk baru; (c) Memilih pasar yang akan dipilih untuk produk baru perusahaan.

Dalam pencitraan medis, seperti PET scan (Positron emission tomography), analisis cluster dapat digunakan untuk membedakan antara berbagai jenis jaringan dan darah dalam gambar tiga dimensi. Dalam aplikasi ini, posisi sebenarnya tidak masalah, namun intensitas voxel dianggap sebagai vektor, dengan dimensi untuk setiap gambar yang diambil dari waktu ke waktu. Teknik ini memungkinkan, misalnya, pengukuran akurat dari tingkat pelacak radioaktif dikirim ke daerah yang menarik, tanpa pengambilan sampel terpisah dari darah arteri, teknik mengganggu yang paling umum saat ini. (ref 2)

Dalam analisis penelitian pendidikan, data untuk clustering dapat berupa data siswa, orang tua, jenis kelamin atau nilai ujian. Clustering merupakan metode penting untuk memahami dan utilitas dari cluster dalam penelitian pendidikan.

Cluster analisis dalam penelitian pendidikan dapat digunakan untuk data eksplorasi, cluster konfirmasi dan pengujian hipotesis. Data eksplorasi digunakan ketika ada sedikit informasi tentang sekolah atau siswa yang akan dikelompokkan bersama-sama. Ini. bertujuan untuk menemukan setiap cluster yang berarti unit berdasarkan langkah-langkah pada satu set variabel respon. Konfirmasi cluster digunakan untuk mengkonfirmasikan hasil cluster yang dilaporkan sebelumnya pengujian Hipotesis yang digunakan untuk mengatur struktur cluster.(3)

Beberapa istilah Analisis Cluster antara lain :

Aggomerration schedule : merupakan jadwal yang akan memberikan informasi tentang ibjek atau kasus yang akan dikelompokkan pada setiap tahap pada suatu proses analisis cluster yang hierarkis.

Cluster centroid : merupakan nilai rata-rata variabel dari semua objek/kasus atau observasi dalam cluster tertentu

Cluster centers, adalah titik awal dimulainya pengelompokan di dalam cluster nonhierarki.

Cluster membership merupakan keanggotaan yang menunjukkan cluster.

Dendogram merupakan visualisasi cluster. Garis vertical (Y) menunjukkan cluster yang digabung bersama. Posisi garis pada skala X menunjukkan jarak (distance) dimana cluster digabung.

Distance between cluster center adalah jarak yang menunjukkan bagaimana terpisahnya pasangan individu cluster.

Dua metode analisis Cluster adalah Hierarchical Cluster dan K-means Cluster. Hierarchical Cluster disarankan untuk data dengan sampel kecil, sedangan K-means cluster disarankan untuk sampel bersa (lebih dari 100)

Selanjutnya :

k-Means Clustering

Hierarchical Cluster

 

======================================================

Referensi :

(1)    Ref 1

(2)   Ref 2

(3)   Ref 3

Lihat juga

Cluster Analysis: Basic Concepts and Algorithms di sini

Finch, H. (2005). Comparison of distance measures in cluster analysis with dichotomous data. Journal of Data Science, 3, 85-100

Huberty, C. J., Jordan, E. M., & Brandt, W. C. (2005). Cluster analysis in higher education research. In J. C. Smart (Ed.), Higher Education: Handbook of Theory and Research (Vol. 20, pp. 437-457). Great Britain: Springer.

Advertisements

Posted on June 23, 2011, in Cluster Analysis. Bookmark the permalink. 1 Comment.

  1. permisi pak, ada yang ingin saya tanyakan.. bila variabel analisis cluster didapatkan dari hasil analisis faktor apakah artinya tidak perlu uji multikolinearitas lagi? terima kasih atas perhatiannya

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: