Berkenalan dengan KNIME

Meilisa Dwi N
4 min readJan 24, 2022

--

KNIME? Konstanz Information Miner.

Pernahkah mendengar nama aplikasi ini?

KNIME adalah salah satu software pengolahan data yang bersifat open source, dapat digunakan untuk kebutuhan Machine Learning, Deep Learning, dan NLP. Keunggulan KNIME adalah para pengguna tidak diwajibkan menguasai koding karena cara pengorepasiannya cukup “drag and drop”. Meski demikian, fitur yang ditawarkan KNIME tergolong lengkap, mulai dari data preprocessing, data visualization, modeling, dan masih banyak lagi. Untuk mendownload aplikasi ini, silakan menuju halaman berikut.

Sebagai orang berlatar belakang non-IT yang ingin menekuni bidang data sains, tentu bertemu KNIME bagi saya bagaikan bertemu mata air di tengah teriknya kemarau. Menyegarkan. Sebelumnya, saya pernah mempelajari dasar SQL dan Python melalui online course, dan jujur saja saya cukup kewalahan karena harus menghafal banyak sekali syntax.

Awal mula saya mengetahui KNIME adalah saat saya dinyatakan lolos menjadi salah satu dari 15 peserta Data Squad Academy Batch 1. Tujuan utama dari DSA adalah membantu para pelaku UMKM, khususnya di Jawa Timur untuk memanfaatkan data sehingga keputusan bisnis yang diambil menjadi efektif dan efisien. Program DSA ini merupakan hasil kolaborasi dari Pemprov Jatim, MJC dan EJSC, dengan Yayasan Open Source Community sebagai mentor. Karena data yang akan diolah bisa dikategorikan sederhana, yaitu data transaksi dari UMKM, maka KNIME dipilih karena kemudahan dalam penggunaannya, juga karena fitur yang tersedia telah cukup untuk mengolah data para pelaku UMKM.

Flyer Pendaftaran DSA Batch 1

Program DSA terdiri dari 2 sesi, yaitu online dan offline. Sesi online merupakan kegiatan belajar melalui media Zoom Meeting pada bulan Desember 2021 dengan materi dasar Data Sains. Kemudian sesi offline diadakan pada tanggal 12–16 Januari 2022 dengan topik utama penggunaan KNIME untuk pengolahan data.

Kegiatan Pembelajaran Offline

Project utama yang kami kerjakan ketika sesi offline adalah mengolah data transaksi sehingga dapat memberi insight kepada kafe X (nama usaha dirahasiakan karena berkaitan dengan kode etik) untuk meningkatkan penjualan dan membuat promo yang efisien. Kami dibagi menjadi 2 tim, dan dalam waktu 24 jam kami harus sudah menyelesaikan project tersebut dan mempresentasikan kepada Wakil Gubernur Jatim, Bapak Emil Dardak, serta Kepala Diskop-UMKM Jatim, Ibu Andromeda.

((Tahapan pengolahan dataset transaksi kafe X akan saya tulis di post berikutnya))

Konsep dasar penggunaan KNIME adalah membuat workflow yang tepat untuk mengolah data. Setiap workflow terdiri atas beberapa nodes. Nodes yang tersedia sangat banyak, mulai dari read / write files, data normalizer, data partitioning, algoritma, data visualization, dan lain-lain. Oleh karena itu, seperti yang saya katakan di awal, penggunaan aplikasi ini cukup drag nodes dari node repository dan men-dropnya ke bagian workflow editor. Tidak berhenti di sana, kemudahan lainnya adalah para pengguna dapat saling berbagi workflow dan saling berdiskusi karena terdapat komunitas pengguna. Jika kita tidak memiliki ide nodes apa saja yang harus digunakan tetapi kita telah tahu tujuan akhir pengolah dataset, maka kita tidak perlu khawatir. Kita bisa melakukan pencarian di KNIME Hub dan mendownload workflow yang tersedia di sana. Saat artikel ini saya tulis, tersedia 7.573 workflow di KNIME Hub.

KNIME Hub

Misalkan, saya ingin melakukan clustering dengan algoritma k-means, tetapi saya masih bingung nodes apa saja yang harus saya gunakan. Maka saya mencoba melakukan pencarian dengan kata kunci “K-Means” di KNIME Hub. Berikut salah satu contoh workflow yang tersedia. Setelah didownload dan diimpor, workflow ini juga dapat diedit jika kita merasa ada yang perlu ditambahkan atau dikurangi.

Contoh workflow K-Means. Sumber: https://hub.knime.com/knime/spaces/Academic%20Alliance/latest/Guide%20to%20Intelligent%20Data%20Science/Example%20Workflows/Chapter7/02_kMeans~t8UVEQH1sTTkus_w

Dengan menggunakan KNIME, seseorang dapat melakukan pengolahan data dan lebih fokus pada hal-hal selain koding. Menurut saya pribadi, mempelajari koding itu perlu, namun sebelum itu tentu lebih penting untuk menguatkan fundamental data sains dan mempelajari logika sehingga diperoleh model yang tepat.

Sekian yang dapat saya tulis, terima kasih telah membaca dan saya akan sangat terbuka untuk berdiskusi. *Mohon maaf dan mohon koreksi jika ada kesalahan.

--

--

Meilisa Dwi N
Meilisa Dwi N

Written by Meilisa Dwi N

Meilisa is a photography enthusiast who has interest in agriculture.

No responses yet