• Pendaftaran
  • Webmail
  • Perpustakaan
  • Portal Akademik
  • Universitas
  • Indonesia
    • English
Universitas Gadjah Mada Departemen Ilmu Komputer dan Elektronika
Fakultas Matematika dan Ilmu Pengetahuan Alam
  • Home
  • Departemen
    • Manajemen
    • Staf Administrasi & Teknis
    • Fasilitas
    • Kontak & Lokasi
  • Program Studi
    • S1 Ilmu Komputer
    • S1 Elektronika dan Instrumentasi
    • Magister Ilmu Komputer
    • Program Magister Elektronika dan Instrumentasi
    • Magister Kecerdasan Artifisial
    • Program Doktor Ilmu Komputer
  • Riset
    • Kelompok Riset
      • Elektronika dan Instrumentasi
      • Sistem Komputer dan Jaringan
      • Algoritma dan Komputasi
      • Rekayasa Perangkat Lunak dan Data
      • Sistem Cerdas
      • Lab Riset​ Sistem Tertanam dan Robotika​
    • Roadmap Penelitian dan Pengabdian kepada Masyarakat
    • Laboratorium Layanan
      • Lab Komputer Dasar
      • Lab Elektronika Dasar
      • Lab Instrumentasi Dasar
  • Pengajar & Publikasi
    • Daftar Dosen
  • Akademik & Mahasiswa
    • Pendaftaran
    • Program Pra Doktoral
    • SOP Panduan MBKM DIKE
    • Laporan Evaluasi Semester Program Studi
    • Prosedur
    • Mahasiswa
      • HIMAKOM
      • HMEI
      • OMAH TI
    • Beasiswa
    • Dokumen Akademik
  • Beranda
  • Semua Berita
  • Berita Umum
  • Kegiatan
  • Peneliti DIKE UGM Kaji Strategi Adaptasi Language Model untuk Bahasa-Bahasa Daerah Indonesia

Peneliti DIKE UGM Kaji Strategi Adaptasi Language Model untuk Bahasa-Bahasa Daerah Indonesia

  • Kegiatan, Lab Riset Sistem Cerdas
  • 2 Juli 2025, 09.32
  • Oleh: wimbono
  • 0

Yogyakarta, 30 Juni 2025 – Peneliti Departemen Ilmu Komputer dan Elektronika (DIKE), FMIPA UGM, mengembangkan studi empiris terkait kemampuan adaptasi model bahasa (language model) untuk menghadapi keragaman bahasa daerah di Indonesia. Melalui penelitian berjudul “Adapting Language Models to Indonesian Local Languages: An Empirical Study of Language Transferability on Zero-Shot Settings”, dilakukan pengujian terhadap kemampuan transfer model bahasa pada sepuluh bahasa daerah Indonesia, beberapa di antaranya termasuk pada kategori low-resource language. Penelitian ini dilakukan oleh Rifki Afina Putri, Ph.D., dosen sekaligus peneliti di Laboratorium Riset Sistem Cerdas, DIKE UGM. Penelitian ini berhasil diterima dan akan dipresentasikan pada International Conference on Advanced Machine Learning and Data Science (AMLDS 2025), tanggal 19-21 Juli 2025, di Tokyo, Jepang.

Studi ini mengevaluasi kinerja berbagai language model dalam menyelesaikan tugas analisis sentimen pada bahasa-bahasa daerah yang datanya tidak ada proses pelatihan awal (pre-training) model atau disebut sebagai zero-shot setting. Dengan kondisi Indonesia yang memiliki lebih dari 700 bahasa daerah, dan sebagian besar di antaranya masih belum memiliki sumber data digital maupun teknologi pemrosesan bahasa yang memadai, urgensi pengembangan sistem pemrosesan bahasa alami (NLP) yang inklusif menjadi semakin nyata. Tanpa upaya konkret ke arah ini, terdapat risiko semakin lebarnya kesenjangan digital antar bahasa, serta terpinggirkannya warisan linguistik yang menjadi bagian penting dari identitas budaya Indonesia. Penelitian ini diharapkan dapat menjembatani kesenjangan tersebut.

Gambar 1. Ilustrasi metode transfer learning yang diteliti pada studi ini.

Pendekatan yang digunakan dalam penelitian ini mencakup dua strategi utama, yaitu zero-shot transfer dan adapter-based (MAD-X) transfer. Pada pendekatan zero-shot, model bahasa seperti IndoBERT, mBERT, dan XLM-R dilatih menggunakan data dalam Bahasa Indonesia, lalu langsung diuji pada bahasa-bahasa daerah tanpa pelatihan tambahan. Hasilnya menunjukkan bahwa kinerja terbaik diperoleh pada bahasa yang sudah dikenal saat pelatihan awal (seperti Bahasa Indonesia dan Jawa), menurun pada bahasa yang berkerabat, dan paling rendah pada bahasa yang tidak pernah dikenal oleh model sebelumnya.

Untuk meningkatkan kinerja terutama pada bahasa yang tidak dikenal, digunakan metode adapter-based MAD-X. Dalam pendekatan ini, adapter bahasa dilatih terlebih dahulu menggunakan data Wikipedia unlabeled dari bahasa target, lalu dikombinasikan dengan task adapter yang dilatih menggunakan data Bahasa Indonesia. Pendekatan ini terbukti lebih efektif untuk sebagian besar bahasa lokal, bahkan pada beberapa kasus melampaui full fine-tuning, selama tersedia cukup data untuk pelatihan adapter bahasa.

Analisis tambahan terhadap tokenisasi menunjukkan bahwa tingkat keberhasilan transfer tidak hanya dipengaruhi oleh kesamaan kosakata atau jumlah potongan subword, tetapi lebih ditentukan oleh eksposur awal model terhadap bahasa dan kemampuannya membangun pemahaman kontekstual lintas bahasa.

Penelitian ini menegaskan pentingnya pengembangan strategi adaptasi model bahasa yang efisien dan inklusif, khususnya untuk bahasa-bahasa lokal Indonesia yang selama ini masih belum banyak terjangkau dalam pengembangan teknologi bahasa. Ke depan, pengembangan teknik adapter yang lebih fleksibel, perluasan korpus pre-training, serta eksplorasi metode zero-shot atau few-shot learning diharapkan dapat semakin memperluas jangkauan pengembangan NLP pada bahasa-bahasa minoritas, khususnya bahasa daerah di Indonesia.

Penelitian ini juga berkontribusi pada pencapaian Tujuan Pembangunan Berkelanjutan (SDGs), khususnya pada SDG 4 (Pendidikan Berkualitas), SDG 9 (Industri, Inovasi, dan Infrastruktur), serta SDG 10 (Pengurangan Kesenjangan) melalui pengembangan teknologi bahasa yang inklusif untuk menghadapi keberagaman bahasa di Indonesia.

 

Author: Lab SC – Rifki

Editor: Marina

#SDGs4 #SDGs9 #SDGs10

Tags: SDGs SDGs 10: Berkurangnya Kesenjangan SDGs 4: Pendidikan Berkualitas SDGs 9: Industri Inovasi dan Infrastruktur

Programs

  • Undergraduate Programs in Computer Science
    • + Regular Program
    • + International Program
  • Undergraduate Programs in Electronics & Instrumentation
    • + Regular Program
    • + International Program
  • Postgraduates
    • + Magister in Computer Science
    • + Magister in Artificial Intelligence
    • + Magister in Electronics & Instrumentation
  • + Doctorate in Computer Science

Prospective Students, welcome!


Berita UGM

  • Shifting Fashion Trends Underscore Need to Strengthen Indonesia’s Local Clothing Heritage
    Clothing is one of the most essential human needs, and Indonesia boasts remarkable diversity in traditional attire. However, shifting consumer preferences have increasingly marginalized the country’s distinctive fashion heritage.  This issue was the focus of a workshop titled Revitalizing Clothing Culture: Strengthening the Ties of Fashion Industry Based on Tradition and Biodiversity Heritage, held on […]
  • UGM and UNIQLO Establish Education and Career Development Partnership
    Universitas Gadjah Mada (UGM) and PT Fast Retailing Indonesia/UNIQLO have agreed to collaborate in the fields of education and career development, along with other mutually agreed-upon areas. The memorandum of cooperation was signed by UGM Vice Rector for Research, Business Development, and Cooperation, Dr. Danang Sri Hadmoko, and Noriaki Koyama, Director of PT Fast Retailing […]
  • UGM Community Service Students Organize Fun Triathlon to Promote Health and Tourism in Banggai Islands
    Cheers echoed across the Bungin Village Field at dawn on Sunday, Jul. 20, 2025, marking the start of the 2025 Fun Triathlon held in a spirit of togetherness and with a broader level of participation than in previous years.  Carrying the theme ‘Run, Ride, Discover: Exploring the Beauty of Banggai Island!’, the event served not […]
  • UGM and University of Melbourne Experts Highlight Indigenous Communities’ Marginalization
    Indonesia, known for its abundant natural resources and cultural diversity, is home to numerous indigenous communities that continue to face challenges in adapting to modern developments while preserving their long-standing customary traditions.  On the one hand, the existence of indigenous peoples reflects national diversity and identity, deserving of welfare and recognition. In reality, however, legal […]
  • UGM Hosts Workshop to Strengthen Public Communication and Protocol Strategy
    Universitas Gadjah Mada (UGM), through its University Secretariat, organized a workshop on public relations and protocol management on Monday, Jul. 21, 2025, at the Multimedia Room, UGM Central Office.  The event, attended by public relations and protocol staff from all faculties and UGM work units, aimed to enhance the capacity of human resources in managing […]
  • Professor Aprinus Salam of UGM Rejects National Culture Day Designation
    The designation of Oct. 17 as National Culture Day by Minister of Culture Fadli Zon has sparked public debate, drawing criticism from academics, including cultural studies expert Professor Aprinus Salam from Universitas Gadjah Mada (UGM). He firmly expressed his disapproval of the establishment of a National Culture Day. “I have never agreed with the idea […]
  • Edus.id Collaborates with UGM Community Service Team to Promote Sexual Education for Children
    Edus.id, an educational technology startup nurtured by Universitas Gadjah Mada (UGM) and focused on children’s education, continues to demonstrate its commitment to providing safe, engaging, and meaningful learning experiences.  One of its current main focuses is to promote early childhood sexual education in a positive and preventive manner, in response to the challenges of growing […]
  • UGM Holds 3-Minute Presentation Competition to Promote Public Information Literacy Among Students
    The Public Information and Documentation Management Officer of Universitas Gadjah Mada (PPID UGM) organized a 3-Minute Public Information Disclosure Presentation competition. This competition engaged active students from various universities across Indonesia. The activity aimed to enhance knowledge and skills in obtaining and managing public information disclosure within the campus environment. The final round of this […]
  • UGM Ready to Host Jogja Run’nShine
    The UGM Innovation and Creativity Hub (GIK UGM), in collaboration with the Gadjah Mada Law Alumni Family (KAHGAMA) and Sirah Travel, officially launched Jogja Run’nShine on Friday (Jul. 18) at GIK UGM. This event marks the first recreational running event in Indonesia that combines sports, art, music, and local culinary elements into one experience. Jogja […]
  • UGM Supports Cultural Preservation, Holds Karawitan Festival Again
    The Faculty of Philosophy at Universitas Gadjah Mada (UGM) once again hosted the Karawitan Festival and Nusantara Bazaar. This was part of the 58th Anniversary celebration of the Faculty of Philosophy, taking place in the faculty’s hallway on Saturday (Jul. 19). Head of the organizing committee, Dr. Sartini, stated that the idea for holding this […]
Universitas Gadjah Mada

Departemen Ilmu Komputer dan Elektronika

Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Gadjah Mada

Gedung C, Lantai 4

Sekip Utara Bulaksumur Yogyakarta 55281

Introduction

Mahasiswa

©

KEBIJAKAN PRIVASI/PRIVACY POLICY