久久久精品2019免费观看_亚洲国产精品成人久久久_69国产成人综合久久精品91_国产精品久久精品视

Python Unicode編碼由來(lái)

現(xiàn)在我們的電腦上運(yùn)行的編碼都是GBK編碼,我們可以在電腦上寫英文字符,也可以寫中文字符,存取都不會(huì)出現(xiàn)亂碼問(wèn)題。

這個(gè)時(shí)候小日子過(guò)得不錯(cuò)的國(guó)家說(shuō),我們也要用計(jì)算機(jī),于是他們就自己制定了自己的字符編碼表,叫Shift_JIS。

然后韓國(guó)人又制定了自己的字符編碼表,叫Euc-kr。

還有其他國(guó)家自己都制定了自己的編碼表,大家都相安無(wú)事,也不會(huì)有亂碼的問(wèn)題,但是有一定的局限性。

就是韓國(guó)人的計(jì)算機(jī)只能輸入韓文字符和英文字符,咱們中國(guó)人的計(jì)算機(jī)只能輸入中文字符和英文字符,美國(guó)人的計(jì)算機(jī)只能輸入英文字符哈拉丁字符。

如果我們中國(guó)人自己造的計(jì)算機(jī)想要賣到全世界就沒(méi)法賣,因?yàn)槟愀揪筒恢С制渌麌?guó)家的字符,就只能賣給自己國(guó)家。

這個(gè)問(wèn)題怎么解決?其實(shí)咱們國(guó)家的始皇帝在兩千多年前就解決這個(gè)問(wèn)題了,書同文,車同軌。

我們現(xiàn)在愛(ài)好和平,滅國(guó)強(qiáng)制使用GBK編碼這個(gè)辦法實(shí)現(xiàn)不了。那么就需要制定一個(gè)世界通用的標(biāo)準(zhǔn)。

1988年,有幾個(gè)程序員在開發(fā)國(guó)際化程序的時(shí)候,對(duì)于不同國(guó)家的字符在不同計(jì)算機(jī)上不兼容的問(wèn)題,實(shí)在是忍無(wú)可忍了,于是就開啟了Unicode編碼項(xiàng)目,目的是為了開發(fā)出一套支持全世界的字符集。

1989年,ISO(國(guó)際化標(biāo)準(zhǔn)組織)也發(fā)布了UCS字符集草案。

后來(lái)Unicode與UCS意識(shí)到世界上不需要兩套統(tǒng)一的字符,于是兩者進(jìn)行兼容性合并。

1990年開始研發(fā),1994年正式發(fā)布。

這就是Unicode編碼的由來(lái),我們也稱之為萬(wàn)國(guó)碼。

這個(gè)Unicode和我們的GBK編碼一樣,仍然是采用16位二進(jìn)制數(shù)對(duì)應(yīng)一個(gè)字符,只是咱們的GBK編碼到當(dāng)時(shí)只編碼了中文字符和英文字符。

我們常說(shuō)的8位16位值得就是比特位。都是以1024進(jìn)行計(jì)算的。

1bit-->1位二進(jìn)制
8bit=1Bytes(字節(jié))
1KB=1024Bytes
1MB=1024KB
1GB=1024MB
1TB=1024GB

程序員圈子有個(gè)梗,一個(gè)人找程序員朋友借1000元,程序員對(duì)他說(shuō):“要不湊個(gè)整吧!給你加24,湊個(gè)整。”

如果這個(gè)人不是程序員的話,可能會(huì)一臉懵逼。

但是做硬盤的廠商計(jì)算硬盤容量確是以1000進(jìn)行計(jì)算,所以我們買的500G硬盤它的實(shí)際容量只有四百六十多G。

而電信運(yùn)營(yíng)商計(jì)算網(wǎng)速是以比特位進(jìn)行計(jì)算的,他們的單位叫Mbps,這個(gè)b是小寫的,就是兆比特每秒,意思是每秒傳輸?shù)亩M(jìn)制數(shù)的位數(shù)。

而我們常說(shuō)的下載速度是MBps,這個(gè)B是大寫的,就是兆字節(jié)每秒,指的是每秒傳輸字節(jié)的數(shù)量。

1個(gè)字節(jié)=8個(gè)比特位,所以說(shuō)我們用的100兆寬帶實(shí)際上的速度要除以8,在12兆多點(diǎn)的樣子。而且這還是排除干擾后的理想狀態(tài),實(shí)際多數(shù)情況下是達(dá)不到這個(gè)速度的。

由于一個(gè)字節(jié)等于8個(gè)比特位,所以我們會(huì)說(shuō)Unicode里面是以2個(gè)字節(jié)來(lái)表示一個(gè)中文字符的,如果是比較生僻的字,會(huì)采用4個(gè)字節(jié)或者8個(gè)字節(jié)來(lái)表示。

對(duì)于現(xiàn)在的計(jì)算機(jī)來(lái)講,所有國(guó)家的人都可以在同一臺(tái)計(jì)算機(jī)里面,輸入自己國(guó)家的文字了。

未經(jīng)允許不得轉(zhuǎn)載:445IT之家 » Python Unicode編碼由來(lái)

贊 (0) 打賞

相關(guān)推薦

    暫無(wú)內(nèi)容!

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

微信掃一掃打賞