Entropy Naskah Bahasa Sunda Dan Bahasa Jawa Untuk Kompresi Teks Menggunakan Algoritma Binary Huffman Code
Keywords:
Kompresi Teks, Entropy, Bahasa Sunda, Bahasa Jawa, Binary Huffman CodeAbstract
Kompresi adalah suatu teknik untuk memperkecil jumlah ukuran data dari data aslinya dengan tujuan agar lebih efektif dan lebih kecil dalam penyimpanan serta efisien dan lebih cepat dalam proses pentransmisian data. Paper ini membahas studi Entropy Bahasa Sunda dan Bahasa Jawa untuk kompresi teks. Tujuan yang ingin dicapai dari penelitian ini adalah dapat mengetahui Entropy bahasa Sunda sehingga dapat menjadi dasar untuk kompresi teks. Dalam makalah ini, digunakan algoritma Binary Huffman Code untuk menganalisis nilai entropy Bahasa Sunda dan Jawa. Pengkodean dengan metode Huffman Code dibangun dari panjang variabel kode-kode yang disusun dari bit-bit. Simbol yang memiliki nilai probabilitas lebih tinggi akan memperoleh kode-kode paling pendek, sedangkan simbol yang memiliki nilai probabilitas lebih rendah akan memperoleh kode-kode paling panjang. Hasil analisis menunjukan bahwa Entropy Bahasa Sunda sebesar 4.186 bits per simbol, sedangkan Entropy bahasa Jawa sebesar 4.101 bits per simbol.
Downloads
References
C. E. Shannon, A Mathematical Theory of Communication. Bell Syst. Techn. J., 1948.
M. Kuruvila and D. P. Gopinath. Entropy of Malayalam Language and Text Compression Using Huffman Coding. 2014 1st Int. Conf. Comput. Syst. Commun. ICCSC 2014; no. December, pp. 150–155, 2003.
K. Sayood, Introduction to Data Compression. 2012.