Yogyakarta, 7 November 2025 – Laboratorium Sistem Tertanam dan Robotika (Lab STR), Departemen Ilmu Komputer dan Elektronika (DIKE) FMIPA UGM, menyelenggarakan seminar dengan topik “Machine Speech Chain: Modelling Human Speech Perception and Production with Auditory Feedback Mechanism”. Seminar ini menghadirkan Prof. Sakriani Sakti, Professor sekaligus Head of Human-AI Interaction Laboratory dari Nara Institute of Science and Technology (NAIST), Jepang.
Acara dibuka oleh Wahyono, S.Kom., Ph.D., Ketua Departemen Ilmu Komputer dan Elektronika, yang menyampaikan apresiasinya atas terselenggaranya kegiatan ini. Ia berharap seminar tersebut dapat menumbuhkan motivasi dan memperluas wawasan mahasiswa untuk melakukan riset dengan topik-topik terkini di bidang kecerdasan buatan, serta membuka peluang bagi mahasiswa S1 untuk melanjutkan studi pascasarjana di NAIST. Sementara itu, Prof. Dr. Ir. Jazi Eko Istiyanto, M.Sc., selaku Kepala Laboratorium STR, menyampaikan rasa terima kasih atas kunjungan Prof. Sakriani Sakti dan menyampaikan pentingnya kolaborasi internasional dalam mengembangkan penelitian di bidang sistem tertanam dan robotika.

Dalam pemaparannya, Prof. Sakriani memperkenalkan NAIST dan Human-AI Interaction Laboratory yang berfokus pada pengembangan collaborative intelligence antara manusia dan mesin. Ia menjelaskan bagaimana komunikasi alami manusia, terutama melalui ucapan (speech) yang menjadi dasar untuk menciptakan sistem AI yang mampu memahami, meniru, dan merespons interaksi layaknya manusia. Konsep speech chain menjadi bagian utama, dimana mekanisme ucapan manusia dijadikan model untuk membangun sistem pembelajaran mesin yang adaptif dan interaktif.

Prof. Sakriani menjelaskan lebih lanjut tentang pendekatan machine speech chain, yaitu sistem unsupervised learning yang mampu mempelajari bahasa hanya dari data ucapan atau teks. Melalui beberapa pengembangan, seperti multi-speaker speech chain untuk mengatasi kebisingan suara, cross-lingual speech chain untuk pembelajaran lintas bahasa, hingga multi-modal speech chain yang menggabungkan saluran auditori dan visual, riset ini berupaya meniru cara manusia belajar bahasa dari bayi hingga dewasa. Ia juga menyoroti tantangan dalam menghadapi keberagaman bahasa di dunia lebih dari 7.000 bahasa yang membutuhkan pendekatan pembelajaran lebih efisien daripada model supervisi tradisional.

Sesi tanya jawab berlangsung dinamis dengan berbagai pertanyaan menarik dari peserta. Salah satunya terkait penggunaan Generative AI untuk menambah jumlah data sintetis dalam riset pengenalan suara. Prof. Sakriani menjelaskan bahwa meski teknologi generatif mampu membantu memperluas dataset, hasil yang diperoleh belum sepenuhnya dapat menggantikan data alami karena perbedaan aksen, intonasi, dan kecepatan bicara manusia. Pertanyaan lain membahas proses pengumpulan data untuk cross-lingual data collection, di mana Prof. Sakriani menjelaskan beberapa metode yang digunakan dalam penelitian, seperti membaca teks dari majalah hingga mendeskripsikan gambar untuk direkam dan dijadikan dataset pelatihan. Kegiatan ditutup dengan penyerahan plakat dari DIKE kepada narasumber dan sesi foto bersama.
Melalui kegiatan ini, Lab STR DIKE UGM turut berkontribusi dalam mendukung Tujuan Pembangunan Berkelanjutan (SDGs), khususnya SDG 4 (Pendidikan Berkualitas) melalui peningkatan literasi dan kapasitas riset mahasiswa, SDG 9 (Industri, Inovasi, dan Infrastruktur) melalui pengembangan teknologi cerdas dan inovatif, serta SDG 17 (Kemitraan untuk Mencapai Tujuan) dengan kolaborasi riset antara institusi pendidikan di Indonesia dan Jepang.
Penulis: Marina
Editor: alukman
#SDGs4 #SDGs9 #SDGs17
