Sebagai seorang praktisi ataupun staff IT, pernahkah Anda mengalami hal-hal berikut ini ? - Anda bertanggung jawab mengelola data dan menyiapkan laporan.
- Menyiapkan laporan dari sumber data yang tidak reliable.
- Sumber data yang tidak reliable tersebut harus dikelola dengan "pembersihan" terlebih dahulu dari kesalahan, ketidaklengkapan atau ketidakjelasan format data.
- Data teks bersumber dari intranet, internet, ataupun sumber lainnya yang perlu dicari polanya terlebih dahulu. Biasanya Anda menggunakan search / find and replace dari aplikasi teks editor maupun word processor biasa dan memakan waktu yang tidak sedikit.
- Anda berasal dari institusi banking atau telekomunikasi yang sering berhubungan dengan format teks yang tidak terhitung tingkat kompleksitasnya - mulai dari yang paling sederhana sampai dengan yang paling kompleks.
Masalah-masalah tersebut di atas dapat dipecahkan dengan mudah oleh utilitas / aplikasi ETL (Extract, Transform and Load) dan bahasa yang dirancang khusus untuk pengelolaan teks, yaitu Regular Expression (REGEX).
Namun, karena kesibukan yang tidak terhindarkan menyebabkan kita tetap mengelola pemrosesan data tersebut dengan cara cukup "tradisional" dan semakin hari semakin membebani kita.
Menyadari hal tersebut, workshop ini mencoba menjawab permasalahan yang dihadapi oleh Anda dengan pendekatan hands on yang praktis. Workshop dirancang dengan penggunaan aplikasi yang mudah didapatkan dan powerful dan juga dituntun oleh instruktur yang sudah sangat kaya pengalaman di bidang pengolahan data.
Peserta Workshop
- Programmer / Developer (Java, VB.net, C#, Javascript, Python, PHP, etc).
- Database Administrator (DBA).
- Database SQL Developer
- ETL / Data Warehouse Developer.
- Spreadsheet / Excel Data Analyst.
Metode Workshop
- Kelas interaktif dengan pemberian dan kasus, sharing pengalaman dan diskusi.
- Evaluasi / review hasil workshop.
- Laptop dibawa sendiri oleh peserta workshop.
Manfaat Workshop
Workshop 2 hari ini dirancang agar peserta dapat memahami dan menguasai keahlian yang dibutuhkan dalam membuat sistem pengolahan teks (pencarian, validasi, dan pengambilan) secara efektif dan dengan tingkat produktifitas yang tinggi menggunakan aplikasi :
- Pentaho Data Integration
- Excel
- Text editor Notepad++
- Browser Mozilla Firefox
Selain itu pembahasan dan penyelesaian kasus-kasus yang disajikan dalam workshop ini diharapkan dapat diaplikasikan langsung dan memberi manfaat nilai lebih pada pribadi / perusahaan para peserta.
InstrukturFeris Thia - Founder dari PHI-Integration
- Konsultan Data Warehouse dan Business Intelligence berbasis Microsoft SQL Server / Pentaho
- Moderator milis Pentaho Indonesia User Group (pentaho-id@googlegroups.com)
Jadwal Workshop
2 & 6 Agustus 2012 (Kamis, Senin).
Pukul 9.00 - 16.00
USD 1,500 Central Park Center Podomoro City, Ruko Grand Shopping Arcade Blok B / 8DH Jl. S. Parman Jakarta Barat, DKI Jakarta Indonesia 11470
Fasilitas
- Materi workshop.
- Media CD / DVD berisi aplikasi software dan contoh file / database yang digunakan.
- 2 Snack Time + 1 Lunch
Pokok Bahasan
Hari Pertama - Sesi 1
- Pembukaan dan Persiapan Workshop
- Pembukaan
- Perkenalan Metode Workshop
- Instalasi :
- Notepad++
- Pentaho Data Integration / Kettle
- MySQL Database Server.
- Contoh-contoh Data (File Teks, Excel dan Database MySQL)
- Perkenalan Regular Expression (REGEX)
- Apa dan kenapa REGEX ?
- Kasus-kasus umum penggunaan REGEX.
- Adopsi REGEX di berbagai produk aplikasi IT !
- Pencocokan Karakter (Characters Match)
- Metacharacter
- Character Classes
- Range di Character Classes
- Perulangan (Repetition)
- Character Shorthands and Backslash Quote.
- Excel dan REGEX
- nstalasi modul VB untuk menambahkan fungsi REGEX.
- Perkenalan dan penggunaan modul REGEX.
- Praktek :
- Pemeriksaan dan pengambilan alamat email yang valid.
- Mendeteksi Penerbit Kartu Kredit berdasarkan nomor kartu kredit.
- Review dan Quiz
Hari Pertama - Sesi 2
- REGEX Intermediate
- Negated Character Classes
- Grouping
- POSIX Character Classes
- Mode Modifiers
- Greedy Quantifiers
- Pengenalan Notepad++
- Penggunaan Notepad++ sebagai editor teks
- Fungsi pencarian dan penggantian teks (find and replace) berbasis REGEX
- Praktek :
- Pengolahan log file web server.
- Restrukturisasi perintah SQL.
- Review dan Quiz
Hari Kedua - Sesi 1
- Pengenalan Pentaho Data Integration
- Menjalankan Pentaho Data Integration (PDI)
- Transformasi Data pada PDI (Step, Hop, Row dan Metadata)
- Perkenalan pada step :
- Excel Input / Output, Text Input / Output dan Table Input / Output
- Stream Lookup
- Select Values
- Pengkontrolan melalui Job (Email, Scheduler, Conditional Check, dll)
- Review dan Quiz
Hari Kedua - Sesi 2
- REGEX di dalam Pentaho Data Integration
- REGEX sebagai standar “wildcard” di Pentaho Data Integration
- Identification and Extraction steps (Identifikasi dan ekstraksi teks)
- Validation steps (validasi / verifikasi)
- Kasus :
- Pengambilan Nilai Kurs dari halaman web.
- Pengambilan data kota dan kabupaten dari halaman web Wikipedia.
- Validasi dan Mendeteksi Penerbit Kartu Kredit berdasarkan nomor kartu kredit.
- Validasi data Excel yang tidak memenuhi pola angka dan konvensi kode produk
- Solusi PDI : Mengirimkan dan Menerima Hasil Perintah SQL via Email
- Mempersiapkan konfigurasi SMTP server.
- Copy dan penjelasan penggunaan script.
- Pembahasan dan Penyelesaian 4 Kasus Praktis.
|
|