霍夫曼編碼屬于有損壓縮(霍夫曼編碼)
關(guān)于霍夫曼編碼屬于有損壓縮,霍夫曼編碼這個(gè)問(wèn)題很多朋友還不知道,今天小六來(lái)為大家解答以上的問(wèn)題,現(xiàn)在讓我們一起來(lái)看看吧!
1、霍夫曼編碼是一種被廣泛應(yīng)用而且非常有效的數(shù)據(jù)壓縮技術(shù),根據(jù)待壓縮數(shù)據(jù)的特征,一個(gè)可壓縮掉20%~90%。
2、這里考慮的數(shù)據(jù)指的是字符串序列。
3、要理解霍夫曼編碼,先要理解霍夫曼樹(shù),即最優(yōu)二叉樹(shù),是一類帶權(quán)路徑長(zhǎng)度最短的樹(shù)。
4、路徑是指從樹(shù)中一個(gè)結(jié)點(diǎn)到另一個(gè)結(jié)點(diǎn)之間的通路,路徑上的分支數(shù)目稱為路徑長(zhǎng)度。
5、樹(shù)的路徑長(zhǎng)度是從樹(shù)根到每一個(gè)葉子之間的路徑長(zhǎng)度之和。
6、結(jié)點(diǎn)的帶權(quán)路徑長(zhǎng)度為從該結(jié)點(diǎn)到樹(shù)根之間的路徑長(zhǎng)度與該結(jié)點(diǎn)權(quán)的乘積,樹(shù)的帶權(quán)路徑長(zhǎng)度為樹(shù)中所有葉子結(jié)點(diǎn)的帶權(quán)路徑長(zhǎng)度之和.霍夫曼樹(shù)是指所有葉子結(jié)點(diǎn)的二叉樹(shù)中帶權(quán)路徑長(zhǎng)度最小的二叉樹(shù).當(dāng)給定了n個(gè)葉子結(jié)點(diǎn)的權(quán)值后,構(gòu)造出的最優(yōu)二叉樹(shù)的結(jié)點(diǎn)數(shù)目m就確定了,即m=2n-1,所以可用一維結(jié)構(gòu)樹(shù)組來(lái)存儲(chǔ)最優(yōu)二叉樹(shù)#define MAXLEAFNUM 50 /*最優(yōu)二叉樹(shù)中最大葉子樹(shù)目*/struct node{ char ch; /*當(dāng)前結(jié)點(diǎn)表示的字符,對(duì)于非葉子結(jié)點(diǎn),此域不用*/ int weight; /*當(dāng)前結(jié)點(diǎn)的權(quán)值*/ int parent; /*當(dāng)前結(jié)點(diǎn)的父結(jié)點(diǎn)的下標(biāo),為0時(shí)表示無(wú)父結(jié)點(diǎn)*/ int lchild,rchild; /*當(dāng)前結(jié)點(diǎn)的左,右孩子結(jié)點(diǎn)的下標(biāo),為0時(shí)表示無(wú)孩子結(jié)點(diǎn)*/}HuffmanTree[2 * MAXLEAFNUM];typedef char *HuffmanCode[MAXLEAFNUM + 1];創(chuàng)建最優(yōu)二叉樹(shù)void createHTree(HuffmanTree HT, char *c, int *w, int n){ /*數(shù)組c[0..n-1]和w[0..n-1]存放了n個(gè)字符及其概率,構(gòu)造霍夫樹(shù)HT*/ int i, s1, s2; if (n <= 1) return;/*根據(jù)n個(gè)權(quán)值構(gòu)造n棵只有根結(jié)點(diǎn)的二叉樹(shù)*/ for (i=1; i<=n; i++) { HT[i].ch = c[i-1]; HT[i].weight = w[i-1]; HT[i].parent = HT[i].lchild = HT[i].rchild = 0; }for (; i<2*n; ++i) { HT[i].parent = 0; HT[i].lchild = 0; HT[i].rchild = 0; }/*構(gòu)造霍夫曼樹(shù)*/ for (i=n+1; i<2*n; i++) { /*從HT[1..i-1]中選擇parent為0且weight最小的兩棵樹(shù),其序號(hào)為s1和s2*/ select(HT,i-1,s1,s2); HT[s1].parent = i; HT[s2].parent = i; HT[i].lchild = s1; HT[i].rchild = s2; HT[i].weight = HT[s1].weight + HT[s2].weight; }}應(yīng)用霍夫曼編碼假設(shè)有一個(gè)包含100 000個(gè)字符的數(shù)據(jù)文件要壓縮存儲(chǔ)。
7、各字符在該文件中的出現(xiàn)頻度見(jiàn)表1。
8、僅有6種不同字符出現(xiàn)過(guò),字符a出現(xiàn)了45000次。
9、 a b c d e f 頻度(千字) 45 13 12 16 9 5固定代碼字 000 001 010 011 100 101變長(zhǎng)代碼字 0 101 100 111 1101 1100表1 一個(gè)字符編碼問(wèn)題。
10、大小為100 000個(gè)字符的一個(gè)數(shù)據(jù)文件僅包含字符a~f,每個(gè)字符出現(xiàn)的頻度如表中所示。
11、如果對(duì)每個(gè)字符賦予一個(gè)三位的編碼,則該文件可被編碼為300000位。
12、如果利用表中的可變長(zhǎng)度編碼,該文件可被編碼為224000位。
13、可以用很多種方式來(lái)表示這樣一個(gè)文件。
14、采用固定長(zhǎng)度編碼,則需要三位二進(jìn)制數(shù)字來(lái)表示六個(gè)字符:a=000,b=001,…,f=101。
15、這種方法需要300 000來(lái)對(duì)整個(gè)原文件編碼。
16、 而可變長(zhǎng)度編碼是對(duì)頻度高的字符賦以短編碼,而對(duì)頻度低的字符賦以較長(zhǎng)一些的編碼。
17、表1顯示了這種編碼,其中一位串0表示a,四位串1100表示f。
18、這種編碼方式需要 (45*1+13*3+12*3+16*3+9*4+5*4)*1000 = 224 000 位來(lái)表示整個(gè)文件,即可壓縮掉約25%。
19、這其實(shí)就是最優(yōu)字符編碼(霍夫曼編碼)前綴編碼我們這里考慮的編碼方案中,沒(méi)有一個(gè)編碼是另一個(gè)編碼的前綴。
20、這樣的編碼稱為前綴編碼(或許“無(wú)前綴編碼“是個(gè)更好的名字,但是前綴編碼是標(biāo)準(zhǔn)的書(shū)面語(yǔ))。
21、 對(duì)任何一種二進(jìn)制字符編碼來(lái)說(shuō)編碼總是簡(jiǎn)單的,這只要將文件中表示每個(gè)字符的編碼并置起來(lái)即可。
22、利用表1的可變長(zhǎng)度編碼,把包含三個(gè)字符的文件abc編成0 . 101 . 100 = 0 101 100,其中“.“表示并置。
23、 在前綴編碼中解碼也是很方便的。
24、因?yàn)闆](méi)有一個(gè)碼是其他碼的前綴,故被編碼文件的開(kāi)始處的編碼是確定的。
25、我們只要識(shí)別出第一個(gè)編碼,將它翻譯成原文字符,再對(duì)余下的編碼文件重復(fù)這個(gè)解碼過(guò)程即可。
26、在我們的例子中,可將串001 011 101唯一地分析為0.0.101.1101,因此可解碼為aabe。
27、 解碼過(guò)程需要有一種關(guān)于前綴編碼的方便表示,使得初始編碼可以很容易地被識(shí)別出來(lái)。
28、有一種表示方法就是葉子為給定字符的二叉樹(shù)。
29、在這種樹(shù)中,我們將一個(gè)字符的編碼解釋為從根至該字符的路徑,其中0表示“轉(zhuǎn)向左子結(jié)點(diǎn)”,1表示“轉(zhuǎn)向右子結(jié)點(diǎn)“。
30、如下給出最優(yōu)二叉樹(shù),如圖1。
31、圖1以下給出查找最優(yōu)二叉樹(shù)葉子結(jié)點(diǎn)編碼的算法typedef char *HuffmanCode[MAXLEAFNUM + 1];(本文開(kāi)頭也有說(shuō)明)void HuffmanCoding(HuffmanTree HT, HuffmanCode HC, int n){ /* n個(gè)葉子結(jié)點(diǎn)在霍夫曼樹(shù)HT中的下標(biāo)為1~n,*/ /*第i(1<= i <= n)個(gè)葉子的編碼存放HC[i]中*/ char *cd; int i,start,c,f; if (n<=1) return;/*分配n個(gè)字節(jié)的內(nèi)存,用來(lái)存放當(dāng)前得到的編碼*/ /*n個(gè)葉子結(jié)點(diǎn)最大的編碼長(zhǎng)度為n所以分配n個(gè)字節(jié)*/ cd = (char*)malloc(n) cd[n-1] = ‘/0’;for (i=1; i<=n; i++) { start = n -1; for (c=i,f=HT[i].parent; f!=0; c=f,f=HT[f].parent) /*從葉子結(jié)點(diǎn)開(kāi)始查找編碼*/ /*葉子結(jié)點(diǎn)的父結(jié)點(diǎn)的左子樹(shù)為葉子結(jié)點(diǎn),則編碼為0*/ /*否則就為父結(jié)點(diǎn)的右子樹(shù),則編碼為1*/ if (HT[f].lchild = = c) cd[--start] = ‘0’; else cd[--start] = ‘1’; /*分配內(nèi)存,分配內(nèi)存的字節(jié)數(shù)為當(dāng)前得到的字符編碼數(shù)*/ HC[i] = (char*)malloc(n-start); strcpy(HC[i], &cd[start]);}free(cd);}譯碼算法為:從根結(jié)點(diǎn)出發(fā),按二進(jìn)制位串中的0和1確定是進(jìn)入左分支還是右分支,當(dāng)?shù)竭_(dá)葉子結(jié)點(diǎn)時(shí)譯出該葉子對(duì)應(yīng)的字符。
32、數(shù)據(jù)文件(包含編碼)未結(jié)束,則回到根結(jié)點(diǎn)繼續(xù)進(jìn)行上述過(guò)程。
33、給出如下函數(shù):void Decoding(HuffmanTree HT, int n, char *buff){ /*利用具有n個(gè)葉子結(jié)點(diǎn)的最優(yōu)二叉樹(shù)(存儲(chǔ)在數(shù)組HT中)進(jìn)行譯碼,葉子的下標(biāo)*//*為1~n,buff指向數(shù)據(jù)文件的編碼序列*/int p = 2*n -1; /*指向根結(jié)點(diǎn)*/while (*buff){ if ((*buff) = = ‘0’) p = HT[p].lchild; /*進(jìn)入左分支*/ else p = HT[p].rchild; /*進(jìn)入右分支*//*到達(dá)一個(gè)葉子結(jié)點(diǎn)*/ if(HT[p].lchild = = 0 && HT[p].rchild = = 0) { printf(“%c”, HT[p].ch); p = 2*n – 1; /*回到根結(jié)點(diǎn)*/ }buff++;}}。
本文分享完畢,希望對(duì)大家有所幫助。
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
- foobar2000在播放開(kāi)始后如何自動(dòng)加載歌詞(foobar2000怎么導(dǎo)入歌詞)
- 口袋妖怪·GBA版通用修改器MH圖文使用教程(gba口袋妖怪修改器怎么使用)
- 夢(mèng)幻西游任務(wù)ps怎么加點(diǎn)(夢(mèng)幻西游任務(wù)pt怎么加點(diǎn))
- 長(zhǎng)有骨刺怎么辦(長(zhǎng)有骨刺怎么辦吃什么藥)
- 火車票退票怎么操作(線下火車票退票怎么操作)
- 手機(jī)QQ怎么樣顯示天氣預(yù)報(bào) QQ如何查看天氣預(yù)報(bào)(手機(jī)QQ怎么顯示天氣)
- 魔獸世界魔獸世界懷舊服鮮血熔爐在哪(魔獸世界懷舊服熔爐在哪里得到)
- 蘋果手機(jī)怎么設(shè)置自己想要的鈴聲(蘋果手機(jī)怎么設(shè)置自己想要的鈴聲鬧鐘)
- 電磁爐不加熱是什么原因怎樣修理(蘇泊爾電磁爐不加熱是什么原因怎樣修理)
- 王者榮耀的榮耀稱號(hào)在哪里設(shè)置(王者榮耀的榮耀稱號(hào)在哪里設(shè)置出來(lái))
- 原神2.0尋找結(jié)界在哪(原神尋找結(jié)界怎么過(guò))
- 如何提高國(guó)民的法律意識(shí)(如何提高國(guó)民的法律意識(shí)論文)
- 如何辦理居住證?(如何辦理居住證積分)
- 身體缺鈣怎么補(bǔ)(身體缺鈣怎么補(bǔ)鈣)
- 產(chǎn)婦吃什么水果好(剛生完孩子的產(chǎn)婦吃什么水果好)
- 哈利波特魔法覺(jué)醒怎么預(yù)約搶先下載更新?(哈利波特魔法覺(jué)醒預(yù)約截止)
-
6月25-28日,由中國(guó)進(jìn)出境生物安全研究會(huì)、中國(guó)國(guó)際旅行衛(wèi)生保健協(xié)會(huì)主辦,中國(guó)青年創(chuàng)業(yè)就業(yè)基金會(huì)支持,中國(guó)出入...瀏覽全文>>
-
胃腸鏡檢查,聽(tīng)起來(lái)可能有些令人不安,但實(shí)際上,它可能是生活中的救命稻草。對(duì)于一些人來(lái)說(shuō),定期進(jìn)行胃腸鏡...瀏覽全文>>
-
6月16日-20日,2025年優(yōu)秀博士后研究人員(紹興)研學(xué)活動(dòng)順利舉行。本次活動(dòng)匯聚了來(lái)自全國(guó)各地的百余名博士后,...瀏覽全文>>
-
近日,天津松果生物醫(yī)療科技有限公司自主研發(fā)的牛跟腱來(lái)源去端肽I型膠原蛋白原材料成功通過(guò)國(guó)家藥品監(jiān)督管理局...瀏覽全文>>
-
在數(shù)字化產(chǎn)業(yè)轉(zhuǎn)型的浪潮奔涌之際,病理學(xué)正經(jīng)歷著前所未有的革新機(jī)遇。奧偉登(Evident)憑借百年光學(xué)技術(shù)積淀,以...瀏覽全文>>
-
6月6-8日,CHINAGUT 2025中國(guó)腸道大會(huì)在寧波國(guó)際會(huì)議中心隆重舉辦。大會(huì)由南京醫(yī)科大學(xué)第二附屬醫(yī)院、國(guó)家消化...瀏覽全文>>
-
在第28屆北京國(guó)際口腔展這一行業(yè)風(fēng)向標(biāo)級(jí)盛會(huì)上,北京易嶺生物科技有限公司(下面簡(jiǎn)稱易嶺生物)憑借重磅新品發(fā)...瀏覽全文>>
-
2025款上汽大眾ID 4 X在安徽阜陽(yáng)地區(qū)的售價(jià)會(huì)根據(jù)配置和選裝包有所不同。基礎(chǔ)版車型的廠商指導(dǎo)價(jià)大約在20萬(wàn)...瀏覽全文>>
-
嵐圖FREE,作為一款集豪華與智能于一體的新能源SUV,正以全新的姿態(tài)迎接每一位渴望高品質(zhì)出行的用戶。現(xiàn)在,嵐...瀏覽全文>>
-
安徽阜陽(yáng)的大眾ARTEON 2022新款現(xiàn)已到店,最低售價(jià)從34 80萬(wàn)元起,無(wú)疑是近期購(gòu)車的最佳時(shí)機(jī)。這款車型以其...瀏覽全文>>