• Pendaftaran
  • Webmail
  • Perpustakaan
  • Portal Akademik
  • Universitas
  • Indonesia
    • English
Universitas Gadjah Mada Departemen Ilmu Komputer dan Elektronika
Fakultas Matematika dan Ilmu Pengetahuan Alam
  • Home
  • Departemen
    • Manajemen
    • Staf Administrasi & Teknis
    • Fasilitas
    • Kontak & Lokasi
  • Program Studi
    • S1 Ilmu Komputer
    • S1 Elektronika dan Instrumentasi
    • Magister Ilmu Komputer
    • Program Magister Elektronika dan Instrumentasi
    • Magister Kecerdasan Artifisial
    • Program Doktor Ilmu Komputer
  • Riset
    • Kelompok Riset
      • Elektronika dan Instrumentasi
      • Sistem Komputer dan Jaringan
      • Algoritma dan Komputasi
      • Rekayasa Perangkat Lunak dan Data
      • Sistem Cerdas
      • Lab Riset​ Sistem Tertanam dan Robotika​
    • Roadmap Penelitian dan Pengabdian kepada Masyarakat
    • Laboratorium Layanan
      • Lab Komputer Dasar
      • Lab Elektronika Dasar
      • Lab Instrumentasi Dasar
  • Pengajar & Publikasi
    • Daftar Dosen
  • Akademik & Mahasiswa
    • Pendaftaran
    • Program Pra Doktoral
    • SOP Panduan MBKM DIKE
    • Laporan Evaluasi Semester Program Studi
    • Prosedur
    • Mahasiswa
      • HIMAKOM
      • HMEI
      • OMAH TI
    • Beasiswa
    • Dokumen Akademik
  • Beranda
  • Semua Berita
  • Berita Umum
  • Kegiatan
  • Peneliti DIKE UGM Kaji Strategi Adaptasi Language Model untuk Bahasa-Bahasa Daerah Indonesia

Peneliti DIKE UGM Kaji Strategi Adaptasi Language Model untuk Bahasa-Bahasa Daerah Indonesia

  • Kegiatan, Lab Riset Sistem Cerdas
  • 2 Juli 2025, 09.32
  • Oleh: wimbono
  • 0

Yogyakarta, 30 Juni 2025 – Peneliti Departemen Ilmu Komputer dan Elektronika (DIKE), FMIPA UGM, mengembangkan studi empiris terkait kemampuan adaptasi model bahasa (language model) untuk menghadapi keragaman bahasa daerah di Indonesia. Melalui penelitian berjudul “Adapting Language Models to Indonesian Local Languages: An Empirical Study of Language Transferability on Zero-Shot Settings”, dilakukan pengujian terhadap kemampuan transfer model bahasa pada sepuluh bahasa daerah Indonesia, beberapa di antaranya termasuk pada kategori low-resource language. Penelitian ini dilakukan oleh Rifki Afina Putri, Ph.D., dosen sekaligus peneliti di Laboratorium Riset Sistem Cerdas, DIKE UGM. Penelitian ini berhasil diterima dan akan dipresentasikan pada International Conference on Advanced Machine Learning and Data Science (AMLDS 2025), tanggal 19-21 Juli 2025, di Tokyo, Jepang.

Studi ini mengevaluasi kinerja berbagai language model dalam menyelesaikan tugas analisis sentimen pada bahasa-bahasa daerah yang datanya tidak ada proses pelatihan awal (pre-training) model atau disebut sebagai zero-shot setting. Dengan kondisi Indonesia yang memiliki lebih dari 700 bahasa daerah, dan sebagian besar di antaranya masih belum memiliki sumber data digital maupun teknologi pemrosesan bahasa yang memadai, urgensi pengembangan sistem pemrosesan bahasa alami (NLP) yang inklusif menjadi semakin nyata. Tanpa upaya konkret ke arah ini, terdapat risiko semakin lebarnya kesenjangan digital antar bahasa, serta terpinggirkannya warisan linguistik yang menjadi bagian penting dari identitas budaya Indonesia. Penelitian ini diharapkan dapat menjembatani kesenjangan tersebut.

Gambar 1. Ilustrasi metode transfer learning yang diteliti pada studi ini.

Pendekatan yang digunakan dalam penelitian ini mencakup dua strategi utama, yaitu zero-shot transfer dan adapter-based (MAD-X) transfer. Pada pendekatan zero-shot, model bahasa seperti IndoBERT, mBERT, dan XLM-R dilatih menggunakan data dalam Bahasa Indonesia, lalu langsung diuji pada bahasa-bahasa daerah tanpa pelatihan tambahan. Hasilnya menunjukkan bahwa kinerja terbaik diperoleh pada bahasa yang sudah dikenal saat pelatihan awal (seperti Bahasa Indonesia dan Jawa), menurun pada bahasa yang berkerabat, dan paling rendah pada bahasa yang tidak pernah dikenal oleh model sebelumnya.

Untuk meningkatkan kinerja terutama pada bahasa yang tidak dikenal, digunakan metode adapter-based MAD-X. Dalam pendekatan ini, adapter bahasa dilatih terlebih dahulu menggunakan data Wikipedia unlabeled dari bahasa target, lalu dikombinasikan dengan task adapter yang dilatih menggunakan data Bahasa Indonesia. Pendekatan ini terbukti lebih efektif untuk sebagian besar bahasa lokal, bahkan pada beberapa kasus melampaui full fine-tuning, selama tersedia cukup data untuk pelatihan adapter bahasa.

Analisis tambahan terhadap tokenisasi menunjukkan bahwa tingkat keberhasilan transfer tidak hanya dipengaruhi oleh kesamaan kosakata atau jumlah potongan subword, tetapi lebih ditentukan oleh eksposur awal model terhadap bahasa dan kemampuannya membangun pemahaman kontekstual lintas bahasa.

Penelitian ini menegaskan pentingnya pengembangan strategi adaptasi model bahasa yang efisien dan inklusif, khususnya untuk bahasa-bahasa lokal Indonesia yang selama ini masih belum banyak terjangkau dalam pengembangan teknologi bahasa. Ke depan, pengembangan teknik adapter yang lebih fleksibel, perluasan korpus pre-training, serta eksplorasi metode zero-shot atau few-shot learning diharapkan dapat semakin memperluas jangkauan pengembangan NLP pada bahasa-bahasa minoritas, khususnya bahasa daerah di Indonesia.

Penelitian ini juga berkontribusi pada pencapaian Tujuan Pembangunan Berkelanjutan (SDGs), khususnya pada SDG 4 (Pendidikan Berkualitas), SDG 9 (Industri, Inovasi, dan Infrastruktur), serta SDG 10 (Pengurangan Kesenjangan) melalui pengembangan teknologi bahasa yang inklusif untuk menghadapi keberagaman bahasa di Indonesia.

 

Author: Lab SC – Rifki

Editor: Marina

#SDGs4 #SDGs9 #SDGs10

Tags: SDGs SDGs 10: Berkurangnya Kesenjangan SDGs 4: Pendidikan Berkualitas SDGs 9: Industri Inovasi dan Infrastruktur

Programs

  • Undergraduate Programs in Computer Science
    • + Regular Program
    • + International Program
  • Undergraduate Programs in Electronics & Instrumentation
    • + Regular Program
    • + International Program
  • Postgraduates
    • + Magister in Computer Science
    • + Magister in Artificial Intelligence
    • + Magister in Electronics & Instrumentation
  • + Doctorate in Computer Science

Prospective Students, welcome!


Berita UGM

  • UGM Student Team Promotes Ecotourism and Digital Village Development in Temanggung
    Universitas Gadjah Mada (UGM), through its Community Service Program (KKN-PPM), continues to demonstrate its commitment to regional development. UGM has deployed a KKN-PPM student team, Waksudha Bansari, to Bansari District, Temanggung Regency.  This time, the UGM team is collaborating with the Temanggung Regency Government to accelerate the development of ecotourism and digital agriculture. The collaboration […]
  • UGM Student Interns at Japanese Poultry Farm, Gains Insights into Precision Farming and Automation
    Muh. Dino Prasetyo (Dino), a student from the Faculty of Animal Science at Universitas Gadjah Mada (Animal Science UGM), has been interning at a layer poultry farm owned by Crest Co. Ltd. in Japan since February 2025. Throughout his internship, he has gained valuable experiences, particularly in time discipline and precision in performing tasks. At […]
  • UGM Professor Highlights Potential of Plant Bacteria as Natural Alternative to Fertilizers and Pesticides
    Just like humans, plants can also suffer from diseases caused by bacterial infections. The origins of plant bacteriology date back to 1878, marked by the discovery of fire blight disease in pear plants by Thomas Jonathan Burrill. Losses in agricultural production caused by bacterial plant diseases vary depending on the type of disease. Although economic […]
  • UGM to Conduct Internal Safety Review Following KKN Student Tragedy in Southeast Maluku
    Two Universitas Gadjah Mada (UGM) students, Septian Eka Rahmadi and Bagus Adi Prayogo, who lost their lives in a capsized boat accident in the waters of Debut, Manyeuw District, Southeast Maluku Regency, have been transported to their respective hometowns in Sumbawa Besar, West Nusa Tenggara, and Bojonegoro, East Java, on Tuesday, Jul. 1, 2025. Before […]
  • Dr. Adrianto Dwi Nugroho Inaugurated as UGM Professor, Highlights Justice in Global Minimum Tax Policy
    The Global Minimum Tax (GMT) initiative proposed by the Organisation for Economic Co-operation and Development (OECD) aims to create fairness in the tax system, particularly in ensuring that multinational companies pay a fair share of their tax obligations.  However, in recent years, aside from becoming an international economic and political commodity, the GMT policy has […]
  • Dr. Oyas Wahyunggoro Inaugurated as UGM Professor in Heuristic Control
    Dr. Oyas Wahyunggoro, a lecturer at the Department of Electrical Engineering and Information Engineering, Faculty of Engineering, Universitas Gadjah Mada (FT UGM), was inaugurated as a professor in the field of heuristic control on Thursday (Jun. 12). In his inaugural address, titled “Heuristic Control and Its Applications and Development Potential in the Automotive Industry,” Professor […]
  • UGM and Russia’s Positive Technologies Forge Cybersecurity Partnership
    Universitas Gadjah Mada (UGM) has opened opportunities for collaboration with Positive Technologies in areas such as academic capacity building, professional training, joint research, and national digital resilience programs.  This development emerged from a visit by a delegation from the Moscow-based global cybersecurity research company on Wednesday (Jun. 11) at the UGM Central Office. As an […]
  • UGM Campus Mosque Slaughters 50 Sacrificial Animals for Eid al-Adha
    UGM Campus Mosque received more than 50 sacrificial animals this year, donated by individuals and institutional partners. The total consisted of 11 cows, 19 goats, and 36 sheep. “We also received one cow from the rector’s family,” said the Head of the UGM Campus Mosque Takmir Board, Dr. Muhammad Yusuf, on Tuesday (Jun. 10). Dr. […]
  • Three UGM Medical Graduates Earn Perfect 4.00 GPA at Commencement Ceremony
    Three graduates from the Medicine Program at the Faculty of Medicine, Public Health, and Nursing (FK-KMK UGM) achieved a perfect cumulative GPA of 4.00 at the undergraduate and applied undergraduate commencement for the third period of the 2024/2025 academic year held on Wednesday, May 27, at Grha Sabha Pramana.  The three medical graduates are Claire […]
  • Dr. Suharyadi Inaugurated as Professor, Highlights Potential of Hybrid Remote Sensing Image Interpretation
    Optical remote sensing imagery has become an invaluable tool in urban area management, providing essential spatial data for urban environmental planning and management through its varied spatial, temporal, and spectral resolutions.  To identify objects on Earth’s surface in remote sensing imagery, it is necessary to analyze groups of pixels that form diverse spectral and spatial […]
Universitas Gadjah Mada

Departemen Ilmu Komputer dan Elektronika

Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Gadjah Mada

Gedung C, Lantai 4

Sekip Utara Bulaksumur Yogyakarta 55281

Introduction

Mahasiswa

©

KEBIJAKAN PRIVASI/PRIVACY POLICY