Yogyakarta, 16 November 2025 – Program Magister Kecerdasan Artifisial (MKA) Departemen Ilmu Komputer dan Elektronika (DIKE) FMIPA UGM bersama AI Core UGM menyelenggarakan webinar bertajuk “Understanding Data Engineers: The Architects Behind AI Systems” melalui Zoom Meeting pada Minggu, 16 November 2025. Kegiatan ini menghadirkan Malik Fajar Mubarok, mahasiswa MKA yang juga memiliki pengalaman sebagai Data Engineer di Kumparan, yang berbagi pengalaman mengenai peran data engineer dalam membangun dasar sistem AI modern.
AI Core UGM merupakan komunitas dan wadah riset kecerdasan buatan di bawah Himpunan Mahasiswa MKA (HIMMAKA) UGM. Melalui webinar ini, peserta diajak mengenal lebih dekat peran data engineer yang memastikan alur data tersusun dengan baik, aman, dan siap digunakan untuk proses analisis maupun pengembangan model AI.

Dalam pemaparannya, Malik mengawali dengan menjelaskan definisi dan ruang lingkup pekerjaan data engineer, termasuk merancang arsitektur data (designing the blueprint), membangun pipeline dari sumber data hingga insight, serta memastikan sistem berjalan stabil. Ia juga menyampaikan pentingnya menjaga kualitas data dan observability agar proses analisis maupun pelatihan model dapat berlangsung optimal.
Malik kemudian membahas pemrosesan data mulai dari ekstraksi, transformasi, penyimpanan, hingga bagaimana data tersebut akhirnya dimanfaatkan untuk memecahkan permasalahan. Ia menguraikan keterampilan yang wajib dimiliki seorang data engineer, seperti penguasaan database, pemahaman arsitektur cloud, pembuatan ETL/ELT pipeline, hingga kemampuan membaca pola permasalahan dalam sebuah sistem data.

Sesi tanya jawab berlangsung aktif dengan berbagai pertanyaan dari peserta. Salah satu pertanyaan yaitu mengenai struktur data yang ideal untuk model large language model (LLM). Menanggapi hal tersebut, Malik menekankan bahwa kualitas data ditentukan sejak tahap pra-pemrosesan, mulai dari pembersihan, penghapusan duplikasi, hingga normalisasi teks. Ia menambahkan bahwa data yang bersih dan memiliki volume cukup besar memberikan ruang belajar yang lebih luas bagi model sehingga dapat menghasilkan performa yang lebih baik.
Webinar ini mendukung pencapaian Sustainable Development Goals (SDGs), khususnya SDG 4 (Pendidikan Berkualitas) melalui penguatan literasi data dan kecerdasan buatan, SDG 8 (Pekerjaan Layak dan Pertumbuhan Ekonomi) dengan membuka pengetahuan tentang karier dan peningkatan kompetensi digital, serta SDG 9 (Industri, Inovasi, dan Infrastruktur) melalui pemahaman arsitektur data sebagai fondasi dalam pengembangan teknologi cerdas dan transformasi digital.
Author: Marina
Editor: Rifki
#SDGs4 #SDGs8 #SDGs9