Kompresi Data dan Teks

Kompresi Data dan Teks

Kompresi data
·         Kompresi berarti memaptakan / mengecilkan ukuran
·         Kompresi data adalah proses mengkodekan informasi menggunakan bit atau information bearing unit yang lain yang lebih rendah dari pada representasi data yang tidak terkodekan dengan suatu system encoding tertentu.
·         Contoh kompresi sederhan misalnya kata “yang “ dikompres menjadi ata “yg”
·         Pengiriman data hasi l hasil kompresi dapat di lakukan jika pihak pengirim dan pihak penerima memiliki aturan yang sama dalam hal kompresi data .
·         Kompersi data menjadi sangat penting karena memperkrcil kebuthan penyimpanan data , mempercepat pengiriman data , mempertkecil kebutuhan bandwith
·         Contoh teknik kompresi gambar (jpeg , png , Gif ) , audio ( mp3 , AAC , RMA , WMA ) dan video ( MPEG , H261)

·         Jenis kompresi data berdasarkan mode penerimaan data oleh manusia :
- Dialoque Moide : yaitu Proses Penerimaan data dimana pengirim dan penerima seakan
   berdialog ( read time ) , seperti pada contoh video conference.
- Retrieval Mode : yaitu proses penerimaan data tidak dilakukan secara real time.

·        Jenis kompresi data berdasarkan output.
·         Lossy compression
teknik kompresi dimana data hasil dekompresi tidak sama dengan data sebelum kompresi namun sudah “cukup” untuk di gunakan.
biasanya teknik ini membuang bagian bagian data yang sebenarnya tidak begitu dirasakkan , tidak begitu di lihat oleh manusia.
·         Loseless compression
teknik kompresi dimana data hasil kompresi dapat di dekompres lagi dan hasilnya tepat sama seperti data sebelum proses kompresi .

·        Klasifikasi teknik kompresi
·         Entropy encoding
bersifat loseless
teknik tidak berdasarkan media dengan spesifikasi dan katarestik tertentu namun berdasarkan urutan datanya.
statiatical encoding , tidak memperhatikan semantic data
contoh : run – leght encoding , Huffman coding

·         Source coding
bersifat lossy
berkaitan dengan data semantic (arti data ) dan media .
contoh : prediction (DPCM ,DM ) , Transformation (FFT , DCT ), layered coding ( bit position , subsamping ) , vector quantization.
·         Hybrid Coding
gabungan antara lossy dan loseless
contoh : JPEG , MPEG  

CONTOH TEKNIK KOMPRESI TEKS


·         RUN length ENCODING ( RLE )
- Kompresi data teks dilakukan jika ada beberapa huruf yang sama yang di tampilkan berturut”
- Memiliki 2 tipe , yaitu RLE tipe 1 dan RLE tipe 2
- RLE tipe 1 ( menimal 4huruf sama )
- RLE tipe 1 menggunakan tanda “!”
                     Contoh : ABCCCCCCCCCCCCCCCCCDEFGGGGG
- RLE tipe 2 menggunakan tanda negative ( - ) dan psitif ( + )
JAWAB .

- RLE tipe 1 : ABC!8DEFG!4
- RLE Tipe 2 : -2Ab8C-3DEF4G


·       Static Huffman Coding Algorithm
§  Frekwensi karakter dari string yang akan di kompres di analisis terlebih dahulu
§  Selanjutnya di buat pohon Huffman yang merupakan pohon biner dengan root awal yang di beri nilai 0 ( disebelah kiri ) atau 1 ( disebalah kanan ) , sedangkan selanjutnya untuk dahan sebelah kiri selalu di beri nilai 1 dan kanan di ber I nilai 0.
§  A bottom up Approach = frekwensi kecil di kerjakan terlebih dahulu dan di letakan ke dalam leaf ( daun )
§  Kemudian Leaf – Leaf akan di kombinasikan dan di jumlahkan probalitasnya menjadi root di atasnya .
o   Contoh :       MAMA SAYA .
A = 4 -> 4/8 = 0,5
M = 2 -> 2/8 = 0,25
S = 1 -> 1/8 = 0,125
Y = 1 -> 1/8 = 0,125
TOTAL = 8 KARAKTER


Shannon – fano Algorithm

·         Dikembangkan oleh Sannon dan Robert Fano


ü Algoritma
Ø  Urutkan symbol berdasrkan Frekwensi kemunculannya
Ø  Bagi symbol menjadi 2 bagian secara rekursif , dengan jumlah yang kira kira sama pada kedua bagian , sampai Tiap Bagian hanya terdiri dari suatu symbol.

CONTOH = “HELLO”

JAWAB :
Simbol
H
E
L
O
Jumlah
1
1
2
1


Share: