Artikel Teknis‎ > ‎

Modul Fuzzy Match Pada Excel

Pendahuluan

Fungsi Fuzzy Match sangat berguna pada tahap data cleansing. Fuzzy match digunakan untuk mendeteksi berbagai teks yang memiliki kemiripan erat. Dengan demikian kita dapat menentukan apakah memang terdapat data duplikat (redundant) atau tidak.

Excel sebagai aplikasi analisa yang paling besar populasinya tentunya akan sangat bermanfaat jika memiliki fungsi ini. Dan sayangnya dalam paket standar tidak terdapat fungsi tersebut.

Namun, kita cukup beruntung karena dari forum http://www.mrexcel.com ada yang membagi modul Fuzzy Match. Artikel berikut coba membagi cara instalasi dan penggunaannya. Untuk versi Excel yang digunakan penulis adalah versi 2007.

Instalasi

  1. Jalankan aplikasi MS Excel 2007.
  2. Klik tab "Developer" pada Ribbon.
  3. Klik button "Visual Basic" pada grouping "Code".


  4. Akan muncul editor Visual Basic.


  5. Kunjungi halaman http://www.mrexcel.com/forum/showthread.php?p=955137#974873. Pada posting kedua, pilih dan copy semua yang ada pada bagian Code.


  6. Tempelkan / Paste pada editor Visual Basic yang sedang terbuka (lihat poin 4 di atas).


  7. Simpan modul tersebut.
  8. Selesai

Fungsi-fungsi Fuzzy Lookup

Ada 5 fungsi yang terdapat pada modul tersebut yaitu FuzzyAlg1, FuzzyAlg2, FuzzyHLookup, FuzzyPercent, dan FuzzyVLookup.

Kita akan coba membahas penggunaan FuzzyVLookup, dengan syntax sebagai berikut :

FuzzyVLookup( LookupValue,  
              TableArray, 
              IndexNum,  
              NFPercent,
              
Rank,
              Algorithm,
              AdditionalCols)

Keterangan
  • LookupValue : adalah teks yang akan dicari padanannya.
  • TableArray : sumber data referensi yang akan memberikan hasil pencarian.
  • IndexNum : indeks kolom dari table referensi.
  • NFPercent : adalah batas minimum persentase kemiripan yang dihitung oleh algoritma (default 5%).
  • Rank : adalah urutan ke-n dari daftar hasil pencarian yang ingin diambil.
  • Algorithm : 1,2, dan 3 dimana 1 adalah persamaan karakter, sedangkan 2 adalah persamaan kombinasi kata. 3 adalah penggunaan kedua algoritma 1 & 2.
  • AdditionalCols : jumlah penambahan kolom pengecekan.

Contoh Penggunaan

  1. Masukkan data mentah dan daftar referensi yang akan diperiksa, seperti terlihat pada gambar berikut.


  2. Masukkan pada kolom B2 rumus FuzzyVLookup - cukup 3 parameter - sebagai berikut :

    =FuzzyVLookup(A2,$D$2:$D$12,1)

  3. Terlihat teks "Budi" mendapatkan data referensi paling dekat atau yang paling mirip diantara data referensi lain adalah "Budhi".


  4. Duplikasi / copy rumus tersebut ke cell-cell di bawah kolom B lainnya. Perhatikan hasilnya, apa yang dapat Anda simpulkan ?


  5. Selesai.

Penutup

Fuzzy match sering digunakan sebagai algoritma pembantu untuk menemukan data salah entri atau "kotor" di dalam praktek BI. 

Dan untuk Excel, situs http://www.mrexcel.com menyediakan kepada kita modul Visual Basic yang mengandung fungsi Fuzzy match tersebut.

Pada artikel ini kami tunjukkan cara instalasi modul tersebut untuk Excel 2007 berikut contoh penggunaannya. Semoga bisa bermanfaat bagi kita semua dalam melakukan pengujian data sehari-hari untuk menemukan data yang redundant.

Anda bisa download contoh dokumen dari artikel ini dari url berikut :

Comments