Mengerti, Mencari dan Menumbuhkan Cinta.

Definisi Data Analyst dan Apa yang Dikerjakan

Data analyst menjadi sebuah perbincangan panas karena ini menjadi pekerjaan yang dibutuhkan, namun banyak yang meraba-raba dan bahkan melebih-lebihkan pekerjaan data analyst. Seorang Data Analyst adalah orang yang membuat perusahaan/bisnis mampu memaksimalkan nilai dari data yang mereka miliki melalui alat visualisasi dan pembuatan laporan. Mereka bertanggung jawab dalam membuat profil, membersihkan dan mengubah data. Termasuk mendesain dan membangun sebuah model data yang bisa diubah ukurannya, dan mengimplementasikan kemampuan dari analisa tingkat lanjut untuk menghasilkan laporan untuk menganalisa. 

Dalam bahasa sederhana, dia mendesain data dan menampilkan data tersebut agar mudah dimengerti oleh pemilik data dan pemilik data bisa mengambil keputusan/aksi dari data/informasi yang mereka miliki. 

Mengapa Data Analyst Dibutuhkan?

Bayangkan seperti ini, data yang kamu terima sangat banyak. Mulai barang yang dicari customer, halaman apa saja yang dikunjungi, barang yang akhirnya dibeli dan seterusnya. Data ini adalah contoh sebuah aset bisnis yang ada pada persaingan dunia digital saat ini. Perusahaan bisa memperbaiki situs mereka agar lebih sesuai dengan kebutuhan user, mencari tahu mana yang bekerja dan tidak bekerja. Maka data ini menjadi aset dengan tantangan-tantangan baru. Salah satu yang paling utama adalah mengerti arti dari data dan menggunakan data tersebut untuk mempengaruhi bisnis secara positif. Bisnis-bisnis terus bergumul mengenai penggunaan data mereka, seperti bagaimana menggunakan data secara produktif yang mempengaruhi mereka dalam bertindak(Membuat keputusan).

Jumlah data yang banyak ini sering dimanfaatkan seperti beberapa hal berikut

  • Melacak persediaan barang.
  • Mengidentifikasi kebiasaan belanja pelanggan.
  • Mendeteksi pola dari user dan tren yang ada.
  • Memberi rekomendasi barang.
  • Melakukan optimasi harga.
  • Identifikasi dan menghentikan penipuan.

Biasanya akan dicari bedasarkan pola penjualan per hari/bulan, bedasarkan perbandingan data hari antar hari, bulan ke bulan, tahun ke tahun. Sehingga bisa dibandingkan kinerja perusahaan dari waktu ke waktu. Tapi semua itu akan sia-sia tanpa kemampuan bercerita. Dalam dunia bisnis yang cepat dan kompetitif, membuat laporan yang bisa bercerita akan membantu pengambil keputusan dalam mengambil aksi atau keputusan. Mereka sangat bergantung pada cerita yang akurat dan dengan begitu mereka akan semakin akurat dalam mengambil keputusan. Keputusan yang tepat akan membuat mereka makin maju dalam kompetisi dan akan makin banyak keunggulan yang akan mereka miliki. Tanpa sebuah cerita, maka akan sangat susah mengerti apa yang data coba katakan.

Namun data saja tidak cukup, kamu harus mampu merubah bisnis bedasarkan data yang ada. Seperti merelokasikan resource dalam bisnis untuk mengakomodasi kebutuhan atau identifikasi rencana/program bisnis yang gagal dan tahu kapan harus menggantinya. Ini adalah situasi di mana bercerita dengan data sangat penting. Kita tidak bisa mengatakan sebuah program perusahaan gagal, tanpa data yang jelas. Hal tersebut hanya akan dianggap asumsi saja atau preferensi pribadi. Tapi tidak bisa dipungkiri bahwa hal ini sangat berkaitan erat dengan culture sebuah perusahaan. Sementara bercerita itu penting, di mana dan kepada siapa cerita itu diceritakan juga menjadi sebuah hal yang penting. Perlu juga memastikan orang tersebut bisa mencari kebenaran dari cerita, menemukan lokasi/titik yang ada dalam cerita dan masih ada dalam regulasi.

Jadi data analyst dibutuhkan untuk melewati tantangan-tantangan yang ada, mendukung bisnis dan mencari nilai tersebunyi dalam data. Kemudian, semakin berkembangnya dunia menjadi data-driven, storytelling melalui analisa data menjadi komponen vital dan aspek penting dalam bisnis besar dan kecil. Inilah alasan data analyst dibutuhkan. 


Apa yang Dikerjakan Data Analyst

Fokus pekerjaan pada Data analyst ada pada Cleaning, Modelling dan visualisasi data. Konspe analisa data dan kepentingannya dalam bisnis tidak boleh dinilai rendah. Untuk analisa data, komponen utama dari analisa dapat dibagi menjadi beberapa kategori :

  • Descriptive
  • Diagnostic
  • Predictive
  • Prescriptive
  • Cognitive 

Descriptive Analytic membantu menjawab pertanyaan mengenai apa yang terjadi di dalam data historis. Analisa ini mengumpulkan dataset yang besar, mengolahnya dan mendeskripsikan hasil pada stakeholder. Dengan membangun KPI, strategi ini membantu dalam melacak kesuksesan atau kegagalan dari tujuan kunci utama. Contoh menggunakan metrik seperti Return-On Investement(ROI) yang digunakan oleh banyak industri untuk menentukan tingkat pengembalian investasi bedasarkan data yang ada. Namun tidak terbatas pada metrik yang umum saja, perusahaan bisa membuat metrik khusus untuk dibangun yang dapat digunakan untuk melacak peforma mereka dalam industri spesifik.

Diagnostic Analytic membantu menjawab pertanyaan mengapa sebuah kejadian dapat terjadi. Teknik analisa diagnostic melengkapi analisa descriptif untuk mencari penyebab dari sebuah kejadian. Lalu KPI yang ada digunakan untuk menginvestigasi dalam mencari mengapa sebuah kejadian menjadi makin baik atau makin buruk. Secara umum proses ini ada 3 langkah

  1. Identifikasi anomali dalam data. Anomali bisa berupa perubahan tak terduga dalam metrik atau pasar
  2. Mengumpulkan data yang berhubungan dengan anomali
  3. Menggunakan teknik statistik untuk mencari relasi dan tren yang menjelaskan anomali

Predictive analytic digunakan untuk menjawab pertanyaan mengenai apa yang akan terjadi di masa depan, menggunakan data historis untuk identifikasi tren dan kapan terjadinya. Predictive tools dapat mmeberikan insight yang berharga mengenai yang mungkin akan terjadi dalam identifikasi tren dan menentukan kapan terjadinya di masa depan. Teknik-teknik yang ada termasuk variasi statistik dan teknik machine learning seperti neural network, decision trees dan regression analysis.

Prescriptive analytic membantu menjawab pertanyaan mengenai aksi yang harus diambil untuk mencapai tujuan/ target dengan menggunakan insight yang ada. Perusahaan bisa mengambil keputusan yang didorong data(Data Driven). Teknik ini memampukan bisnis untuk membuat keputusan bedasarkan informasi di hadapn ketidak-pastian. Teknik analisa prescriptive bergantung pada machine learning sebagai strategi data pada dataset besar. Dengan menganalisa keputusan dan kejadian di masa lampau, kemudian organisasi bisa mengestimasi kemungkinan hasil yang berbeda bila mengubah variabel-variabel yang ada.

Cognitive analytic adalah sebuah usaha untuk menggambarkan kesimpulan dari data dan pola yang ada, menghasilkan kesimpulan bedasarkan pengetahuan dasar ada dan menambahkan penemuan ini(kesimpulan) menjadi pengetahuan dasar di masa depan untuk keputusan di masa depan. Jadi apa yang dipelajari hari ini akan dijadikan sebuah pengetahuan untuk mengambil keputusan dan hasil dari keputusan itu akan menjadi ilmu dasar baru untuk pengambilan keputusan di masa depan. Analisa kognitif ini membantu belajar mengenai apa yang akan terjadi dan bagaimana kamu menangani situasi. Kesimpulan-kesimpulan dari hasil analisa-analisa yang ada, bukan merupakan hasil dari query database saja, melainkan sebuah hipotesa tak terstruktur yang digabungkan dari berbagai sumber dan diekspresikan dengan berbagai sudut kepercayaan(yang dimiliki oleh perusahaan). Analisa cognitif bergantung pada NLP dan algoritma machine learning untuk membuat masuk akal data yang tidak pernah disentuh seperti review produk dan log dari pembicaraan call center.

Clean, Transform, Load

Apa lagi yang dikerjakan oleh data Analyst? mereka membersihkan, mengubah dan menampilkan data. Bayangkan seperti ini, kita mengambil daya perusahaan yang berasal dari berbagai macam sumber dan saat diolah/digunakan ternyata data tersebut tidak bisa dipakai untuk analisa. Hal-hal yang membuat data tidak bisa digunakan untuk analisa adalah sebagai berikut : 

  • Kolom status pegawai yang isinya hanya angka(kita tidak tahu arti angka tersebut)
  • Beberapa kolom memiliki data yang error.
  • Beberapa kolom memiliki id yang terduplikasi
  • Beberapa kolom memiliki nilai null
  • beberapa kolom mempunyai nilai yang lebih dari 1 arti seperti alamat yang bentuknya[Alamat, kota, propinsi & kode pos] di dalam 1 cell.

Dan saat kita mengolah datanya, mungkin tidak akan terjadi error, namun saat dijadikan dalam bentuk visual maka kita akan mendapatkan bad data, hasil yang tidak tepat, bahkan report sederhana akan memberikan hasil yang salah.  Data yang kotor bisa sangat merepotkan, karena itu tugas data analyst untuk membuat data jadi bersih dan siap digunakan. Data yang bersih mempunyai keunggulan sebagai berikut : 

  1. Pengukuran dan kolom-kolom memberikan hasil akurat saat melakukan pengukuran dan agregasi
  2. Tabel-tabel data lebih terorganisir dan lebih mudah dimengerti.
  3. Duplikasi data hilang dan navigasi data lebih sederhana. Juga menghasilkan kolom yang bisa digunakan sebagai slicer atau filter.
  4. Kolom yang kompleks bisa dijadi menjadi beberapa kolom sederhana dan menggabungkan beberapa kolom untuk kemudahan membaca
  5. Angka-angka atau kode bisa diganti dengan nilai yang bisa dibaca manusia 


 

    Kemudian, karena jumlah sumber data bisa lebih dari 1 maka kita perlu sebuah tools yang bisa melakukan hal-hal sebagai berikut : 

    • Membantu dalam menyelesaikan ketidak-konsistenan data, data yang tidak diharapkan atau null dan masalah kualitas data lainnya.
    • Mengubah nilai menjadi lebih ramah pada user
    • Memprofile data sehingga kita bisa pelajari kolom yang ada secara spesifik sebelum digunakan
    • Evaluasi dan transformasi tipe data sebuah kolom
    • Mengubah bentuk data agar sesuai struktur tabel
    • Menggabungkan query
    • memberikan penamaan yang user friendly

     Mencari tools yang benar-benar sempurna tidak ada. Namun kita bisa menggunakan yang kita familiar. Salah satu yang saya pakai adalah Power BI.

    Komentar