Aturan Lokasi Data

Salah satu yang didobrak oleh pemanfaatan teknologi informasi adalah batasan ruang dan waktu. Sekarang sulit untuk mendefinisikan ruang dan waktu untuk hal-hal yang terkait dengan aplikasi atau layanan yang menggunakan teknologi informasi. Sebagai contoh, sebuah perusahaan di Indonesia menggunakan layanan dari perusahaan Singapura yang memiliki pusat data (data center) di Amerika. Klien (nasabah) dari perusahaan itu warga negara Perancis yang sedang berada di Inggris. Ketika terjadi transaksi, hukum (aturan) mana yang mau dipakai? Indonesia? Singapura? Amerika? Perancis? Inggris?

Sekarang tambah lebih rumit lagi dengan keberadaan layanan “cloud”, yang pada prinsipnya kita tidak perlu tahu lagi lokasi fisik keberadaan data (atau server) kita. Contoh sederhananya adalah kalau kita membuka email kita di Gmail, sebetulnya secara fisik itu data kita berada dimana ya? (Ini belum membicarakan soal backup dan disaster recovery center / DRC.)

Secara bisnis, keberadaan layanan seperti cloud itu memudahkan (dan bahkan lebih murah). Namun secara hukum agak sulit. Sebagai contoh, kalau kita memiliki data transaksi yang bersifat rahasia dan data tersebut secara fisik berada di negara lain, maka akan sulit ketika terjadi masalah atau sengketa. Pengadilan, misalnya, meminta data transaksi tetapi negara dimana data tersebut secara fisik berada tidak memperkenankan datanya diberikan ke pihak lain (aturan privasi di negara tersebut, misalnya). Maka data tidak tersedia. Inilah sebabnya peraturan di berbagai negara (termasuk Indonesia) mewajibkan letak data secara fisik di negaranya.

Di satu sisi, ini dapat “merugikan” secara bisnis. Layanan penyimpanan data di luar negeri boleh jadi lebih murah. Namun, dilihat dari kacamata keamanan (sebagaimana diuraikan di atas), ini bermasalah. Jika kita memilih keamanan (dan sovereignty) dari data kita lebih penting, maka peraturan yang mengharuskan letak data secara fisik harus di Indonesia.

Tambahan lagi adalah pendekatan ini juga menghidupkan bisnis terkait di Indonesia. Keberpihakan ini sangat penting di era persaingan yang kurang seimbang ini. Negara lainpun melakukannya.

Pendapat saya, untuk saat ini lebih baik letak data secara fisik harus berada di Indonesia.

Iklan

Machine Learning: Pengenalan Wajah

Salah satu aplikasi dari Artificial Intelligence (AI) atau Machine Learning adalah dalam pengenalan wajah seseorang. Salah satu perusahaan saya (PT Riset Kecerdasan Buatan) sedang mengembangkan model untuk melakukan hal ini.

Salah satu langkah yang penting dalam machine learning adalah ketersedian data untuk pelatihan (training). Data ini yang akan digunakan untuk mendeteksi orang yang bersangkutan. Proses pengambilan data ini kami sebut proses registrasi. Ada banyak cara melakukan proses registrasi. Yang kami lakukan adalah dengan mengambil video dari orang yang akan dideteksi.

Berikut ini adalah video salah satu kegiatan kami dalam proses registrasi yang disebutkan di atas. Ini kami ambil ketika ProcodeCG sedang memberikan workshop tentang machine learning di Bandung Digital Valley (BDV).

Semoga video singkat ini dapat menunjukkan apa yang kami lakukan di perusahaan kami.

Kegagalan Alat Fingerprint

Salah satu penerapan teknologi informasi yang mulai banyak digunakan adalah alat pemindai sidik jari (fingerprint scanner). Alat ini digunakan untuk mengidentifikasi seseorang berdasarkan sidik jarinya. Pemakaian yang terbanyak adalah untuk menunjukkan kehadiran – istilah sehari-harinya absensi.

Penerapan teknologi ini harus hati-hati sehingga bukan malah membuat masalah. Sebagai contoh, saya sering kesulitan untuk mengidentifikasi diri dengan alat ini. Di kampus saya, alat ini digunakan sebagai tanda kehadiran. Nah, sering saya tidak dapat dikenali oleh alat ini.

Ini contoh video yang saya ambil ketika saya mencoba mencatatkan kehadiran.

Setelah berulangkali gagal, saya menyerah. Hasilnya memang saya dianggap tidak hadir pada hari itu. Terserah lah … Kumadinya welah, kata orang Sunda. he he he.

Block 71 Bandung

Beberapa tahun yang lalu – mungkin sekitar tahun 1998(?) [wah sudah lama ya] – kami menulis dokumen tentang Bandung High-Tech Valley (BHTV). Isinya adalah tentang kawasan Bandung (dan sekitarnya) dapat menjadi cerminan Silicon Valley-nya Amerika. (Ini membutuhkan blog post terpisah.) Salah satu hal yang saya impikan pada waktu itu adalah kawasan jalan Dago – nama resminya adalah Jl. Ir. H. Juanda – berisikan perusahaan-perusahaan yang berbasiskan teknologi. Modelnya mirip dengan Palo Alto-nya Silicon Valley. Jadi bukan kawasan perkantoran seperti yang ada di Jakarta.

Nah, sekarang ini mulai kejadian. Minggu lalu Block 71 Bandung dibuka. Apa itu Block 71 Bandung? Silahkan simak video ini.

Singkatnya, Block 71 adalah inisiatif dari Nasional University Singapore (NUS) Enterprise. Mereka mengembangkan sebuah tempat yang memang alamatnya adalah “Block 71” di Singapura. Tempat itu digunakan untuk mengembangkan banyak start-up. Hasilnya luar biasa. Selain mengembangkan block-block lain di sekitarnya, “Block 71” secara organisasi juga mulai merambah ke negara-negara lain. Indonesia merupakan salah satunya. Di Indonesia saat ini sudah ada Block 71 di Jakarta, Jogjakarta, dan sekaarang di Bandung.

Mengapa jalan Dago ini merupakan hal yang esensial? Karena dia dekat dengan berbagai perguruan tinggi; ITB, UNPAD, UNPAR, UNPAS, UNIKOM, ITHB, dan masih banyak lainnya. Ini salah satu kunci kesuksesan kawasan teknologi, yaitu kedekatan dengan tempat sumber daya manusia (SDM) dan tempat penelitian.

Sebentar lagi akan ada perusahaan-perusahaan teknologi lain di jalan Dago, menggantikan factory outlet yang menjadi jagoannya kota Bandung. ha ha ha. Asyik. Bandung betul-betul menunjukkan diri sebagai kota teknologi yang mendukung entrepreneurship.

Dreams do come true.

Mengapa Bahasa Python?

Saya ingin belajar bahasa pemrograman. Bahasa apa yang sebaiknya saya pelajari?

Pertanyaan ini merupakan salah satu pertanyaan yang sering (dan berulang) ditanyakan. Jawabannya bergantung kepada waktu. Jawaban beberapa tahun yang lalu akan berbeda dengan jawaban sekarang. Ini disebabkan oleh pesatnya perkembangan komputer dan bahasa pemrograman.

Jawaban atas pertanyaan ini pada saat sekarang adalah bahasa Python. Mengapa Python?

  1. Mudah. Definisi “mudah” ini tentu saja harus diperjelas lagi. Dia lebih mudah dipelajari daripada bahasa pemrograman lainnya, sehingga Python digunakan oleh orang dari berbagai bidang – tidak hanya orang yang berlatar belakang teknologi informasi saja. Saya melihat banyak penggunaan Python di bidang sains. Bahasa Python juga merupakan sebuah bahasa yang interpreted, yaitu tidak perlu dirakit (compile) dahulu seperti bahasa pemrograman C misalnya. Ini membuat siklus koding menjadi lebih sederhana.
  2. Tersedia di berbagai sistem operasi. Python tersedia untuk sistem operasi Linux, Mac OS X, Windows, dan seterusnya. Tidak semua bahasa pemrograman tersedia dengan baik untuk berbagai sistem operasi. Artinya siapapun dapat menggunakan Python./
  3. Tersedia banyak pustaka (library). Menurut saya ini aspek yang paling penting dari mengapa belajar bahasa Python. Pustaka (library, module) ini membuat pemrograman kita menjadi lebih mudah karena sudah ada orang lain yang mengembangkan alat bantunya. Untuk melakukan statistik, sudah ada pustakanya. Grafik? Ada juga. Untuk bidang-bidang yang khususpun seperti Artificial Intelligence dan Machine Learning juga sudah ada modulnya. Apapun, nampaknya sudah ada. Ini yang membuat bahasa Python sangat menarik dibandingkan bahasa pemrograman lainnya.

Oh ya. Versi video dari penjelasan ini ada di YouTube. Saya sedang memulai channel Padepokan Budi Rahardjo ini di sana. Silahkan dicek (dan juga dikomentari ya – kalau perlu subscribe juga).

Python dan Perl

Senin lalu melanjutkan memberikan training soal Data Science dengan menggunakan Python. Salah satu tugas yang harus kami lakukan adalah membersihkan data yang diperoleh dari proses dump aplikasi links ke akun twitter. (links -dump http://twitter.com/rahard)

Awalnya saya memulai koding dengan menggunakan bahasa Python, tapi di tengah jalan macet karena saya lupa cara-cara melakukan regular expression (regex) di Python. Misalnya lompati (skip) baris yang memiliki pola penulisan “* sesuatu”. Atau melompati baris yang hanya berisi spasi saja. Sebetulnya saya bisa sih, tetapi harus baca dokumentasinya dulu. Padahal ini lagi live coding. ha ha ha. Harus cepat. Akhirnya yang saya lakukan adalah saya koding awal dengan menggunakan bahasa Perl. ha ha ha.

Di kepala saya memang logika pemrograman diimplementasikan dengan menggunakan bahasa Perl. Jadi kalau mau mengerjakan sebuah kodingan, yang terpikir adalah kodenya dalam bahasa Perl.

Kembali ke kasus tadi. Dalam waktu singkat, kodingan Perl sudah menunjukkan apa yang saya mau (meskipun masih harus dilanjutkan lagi karena ada banyak exception yang harus dilakukan). Poin yang ingin saya sampaikan di kelas ada bahwa untuk melakukan pembersihan terhadap data dapat dilakukan dengan menggunakan skrip. Cara ini efektif meskipun caranya adalah quick and dirty. Namanya juga hacking. Itulah sebabnya dalam deskripsi tentang data science (yang diusulkan oleh Drew Conway), salah satu komponennya adalah “hacking skills“.

Kembali ke kasus (lagi), saya punya pekerjaan rumah untuk membuat versi Python dari kode Perl saya. Hadoh.

 

Sampah Email

Memiliki server email sendiri itu banyak masalah. Salah satunya adalah banyaknya spam. Ini contoh tampilan mailbox saya. Lihat. Ada lebih dari 20 ribu email! Kebanyakan email tersebut adalah spam. Nyebelin.

BR-mailbox-edit

Kalau pasang filter spam di server sendiri bebannya berat sekali. Ini masih harus diukur lagi. Dahulu CPU bisa terpakai banyak untuk ini sehingga email sampai menjadi tertunda. Belum lagi nanti harus memperbaharui (update) filter spam tersebut. Tambah kerjaan saja.

Kalau menggunakan server orang lain, seperti Gmail, enaknya spam sudah difilter. Kita tinggal mendapati email yang sudah “bersih”, meskipun kadang-kadang ada email yang nyasar ke folder spam. Setidaknya waktu kita tidak habis untuk mengurusi spam. Lebih produktif. Sementara ini saya masih menimbang-nimbang apakah memasang kembali filter spam di server mail kami.