ParallelLexCheck adalah sistem validasi konsistensi terjemahan bilingual yang diimplementasikan menggunakan model Bulk Synchronous Parallel (BSP). Sistem ini dirancang untuk membandingkan pasangan (kata asing, terjemahan) terhadap kamus referensi tetap, lalu mengklasifikasikan hasilnya secara deterministik dan paralel.
Proyek ini dikembangkan sebagai bagian dari mata kuliah Sistem Terdistribusi pada Program Studi Teknik Informatika, Universitas Trunojoyo Madura. Fokus utama proyek adalah membuktikan bahwa simulasi BSP pada single-machine menghasilkan output yang konsisten dan setara dengan implementasi paralel nyata menggunakan MPI.
- Validasi konsistensi terjemahan bilingual berbasis kamus referensi
- Klasifikasi otomatis hasil terjemahan: Valid, Invalid, dan Unknown
- Implementasi paralel menggunakan model Bulk Synchronous Parallel (BSP)
- Mendukung dua mode eksekusi : simulasi single-machine dan MPI nyata
- Output deterministik dan konsisten di seluruh mode eksekusi
Setiap pasangan kata diklasifikasikan ke dalam tiga kategori utama:
-
Valid Terjemahan sesuai dengan entri resmi pada kamus referensi.
-
Invalid Kata ditemukan dalam kamus, namun terjemahan tidak sesuai.
-
Unknown Kata tidak ditemukan dalam kamus referensi.
Pendekatan ini memastikan evaluasi terjemahan bersifat objektif, terukur, dan dapat direproduksi.
Sistem mendukung dua pendekatan eksekusi dengan hasil yang ekuivalen:
-
Simulasi BSP (Single-Machine) Implementasi paralel secara konseptual tanpa MPI, digunakan untuk validasi logika dan alur BSP.
-
Implementasi MPI Nyata Menggunakan library
mpi4pyuntuk menjalankan proses paralel sesungguhnya pada environment terdistribusi.
Kedua mode dirancang menghasilkan output yang identik, sehingga memvalidasi kesetaraan antara simulasi dan eksekusi paralel riil.
- Python 3.8+
- (Opsional) Microsoft MPI atau MPI implementation lain
- Library
mpi4pyuntuk mode MPI
# Install dependency utama
pip install -r requirements.txt
# Install mpi4py (jika ingin menjalankan mode MPI)
pip install mpi4pypython src/bsp_simulation.pympiexec -n 4 python src/bsp_mpi.pyJumlah proses (-n) dapat disesuaikan dengan kebutuhan eksperimen.
Proyek ini bertujuan untuk:
- Menerapkan konsep Sistem Terdistribusi secara praktis melalui studi kasus nyata
- Memahami model komputasi Bulk Synchronous Parallel (BSP) dan implikasinya terhadap sinkronisasi proses
- Membandingkan simulasi paralel dengan eksekusi MPI nyata dari sisi logika dan hasil
- Menghasilkan sistem yang deterministik, terukur, dan dapat diuji
Selama pengembangan, tantangan utama terletak pada sinkronisasi antar proses dan penyamaan alur logika antara simulasi BSP dan implementasi MPI. Proses ini memperkuat pemahaman penulis terhadap paralelisme, komunikasi proses, serta debugging pada sistem terdistribusi.
Berikut contoh ringkas hasil klasifikasi:
foreign_word | translation | status
------------ | ----------- | -------
house | rumah | Valid
car | mobilan | Invalid
sky | langit | Unknown
Output disimpan pada folder output/ dan bersifat konsisten di seluruh mode eksekusi.
Proyek ini bersifat akademik dan dapat dikembangkan lebih lanjut untuk:
- Integrasi dengan dataset multilingual skala besar
- Optimasi load balancing antar proses
- Visualisasi performa dan analisis skalabilitas
ParallelLexCheck — 2025.