posted Jun 11, 2012, 7:07 PM by Feris Thia
[
updated Jun 11, 2012, 10:27 PM
]
Kenapa Excel dengan ETL ?
Pada implementasi kebanyakan proyek data warehouse / BI kami, Excel adalah output yang banyak diminta oleh berbagai divisi.
 Selain karena Excel adalah aplikasi perkantoran standar. Banyak pengolahan lanjutan yang bisa dilakukan oleh user untuk mendapatkan laporan akhir.
Beruntung, Pentaho Data Integration - sebagai aplikasi ETL utama kita - mendukung dengan sangat baik output ke format Excel ini dan bahkan dengan performa yang sangat baik.
Di samping itu berbagai konfigurasi advanced bisa dilakukan juga, sehingga fleksibilitas tinggi. Pada artikel kali ini, penulis menunjukkan contoh penggunaan output Excel dengan sumber data dari SQL Server 2008 R2.
Konfigurasi Input SQL Server
- Contoh sumber data yang akan adalah suatu table SQL Server 2008 R2 dengan nama ms_harga_harian dari database phi_minimart, ditunjukkan pada gambar screenshot berikut.
Table ini memiliki 45,018 row data.
- Jalankan aplikasi Spoon - Pentaho Data Integration.
- Buatlah satu transformation baru. Simpan dengan nama yang Anda inginkan, misalkan export_excel.ktr.
- Masukkan step Table Input ke ruang kerja transformation kita.
- Buka dialog step Table Input tersebut, namakan dengan ms_harga_harian. Klik tombol New untuk membuat koneksi baru.
- Pada dialog Database Connection, lakukan konfigurasi untuk koneksi SQL Server Anda.
- Klik tombol Test untuk memastikan koneksi Anda sudah berhasil, klik tombol OK untuk dialog yang muncul.
- Klik tombol OK pada dialog Database Connection untuk mengakhiri konfigurasi.
- Anda akan dibawa kembali ke dialog Table Input. Masukkan query SQL yang Anda inginkan untuk mengambil data. Klik tombol Preview jika diperlukan untuk melihat contoh data yang diambil.
- Klik tombol OK.
- Konfigurasi sumber data Anda sudah selesai, tahap selanjutnya adalah mengirimkan output dalam format Excel.
Konfigurasi Step Microsoft Excel Output
- Tambahkan step Microsoft Excel Output pada ruang kerja kita.
- Hubungkan kedua step tersebut, caranya seperti tampak pada gambar berikut ini.
- Buka step Microsoft Excel Output untuk melakukan konfigurasi lebih lanjut.
- Pada tab File, masukkan lokasi nama file output (tanpa extension).
Jika Anda ingin tanggal dan jam proses dimasukkan, pilih opsi Include date in filename? dan Include time in filename ?.
- Pilih tab Fields, dan klik tombol Get Fields untuk mendapatkan daftar field yang akan dijadikan output.
- Agar outputnya dapat memiliki size column yang disesuaikan dengan isinya, klik tab Content dan centang Auto size columns.
- Klik tombol OK untuk menutup dialog.
- Konfigurasi output telah selesai, sekarang kita akan mencoba menjalankan transformation ini dan melihat hasilnya.
Menjalankan Transformation- Simpan transformation Anda dengan mengklik tombol Save.
- Masih pada ruang kerja yang sama, klik tombol Run this transformation or job.
- Pada dialog yang muncul, klik tombol Launch.
- Transformation akan dijalankan, tunggu sampai selesai. Terlihat pada gambar di bawah ini statistik kecepatan flow ini, yaitu data 45,018 diselesaikan dalam waktu 2 detik.
- Hasil file output dalam bentuk Excel akan Anda dapatkan seperti tampak pada gambar berikut.
- Untuk menjalankan otomatisasi atas script ETL ini, buatlah batch script. Petunjuknya dapat Anda baca disini.
Output Excel yang lebih Baik ?Selain step Microsoft Excel Output, pada Pentaho Data Integration versi 4.2 terdapat Microsoft Excel Writer dengan kemampuan format dan fleksibilitas yang lebih baik.
Untuk informasi lebih lanjut mengenai step ini dapat Anda baca referensinya disini. Sumber Referensi
|
|