久久久精品2019免费观看_亚洲国产精品成人久久久_69国产成人综合久久精品91_国产精品久久精品视

Python Unicode編碼由來

現(xiàn)在我們的電腦上運(yùn)行的編碼都是GBK編碼,我們可以在電腦上寫英文字符,也可以寫中文字符,存取都不會出現(xiàn)亂碼問題。

這個時候小日子過得不錯的國家說,我們也要用計算機(jī),于是他們就自己制定了自己的字符編碼表,叫Shift_JIS。

然后韓國人又制定了自己的字符編碼表,叫Euc-kr。

還有其他國家自己都制定了自己的編碼表,大家都相安無事,也不會有亂碼的問題,但是有一定的局限性。

就是韓國人的計算機(jī)只能輸入韓文字符和英文字符,咱們中國人的計算機(jī)只能輸入中文字符和英文字符,美國人的計算機(jī)只能輸入英文字符哈拉丁字符。

如果我們中國人自己造的計算機(jī)想要賣到全世界就沒法賣,因?yàn)槟愀揪筒恢С制渌麌业淖址?,就只能賣給自己國家。

這個問題怎么解決?其實(shí)咱們國家的始皇帝在兩千多年前就解決這個問題了,書同文,車同軌。

我們現(xiàn)在愛好和平,滅國強(qiáng)制使用GBK編碼這個辦法實(shí)現(xiàn)不了。那么就需要制定一個世界通用的標(biāo)準(zhǔn)。

1988年,有幾個程序員在開發(fā)國際化程序的時候,對于不同國家的字符在不同計算機(jī)上不兼容的問題,實(shí)在是忍無可忍了,于是就開啟了Unicode編碼項(xiàng)目,目的是為了開發(fā)出一套支持全世界的字符集。

1989年,ISO(國際化標(biāo)準(zhǔn)組織)也發(fā)布了UCS字符集草案。

后來Unicode與UCS意識到世界上不需要兩套統(tǒng)一的字符,于是兩者進(jìn)行兼容性合并。

1990年開始研發(fā),1994年正式發(fā)布。

這就是Unicode編碼的由來,我們也稱之為萬國碼。

這個Unicode和我們的GBK編碼一樣,仍然是采用16位二進(jìn)制數(shù)對應(yīng)一個字符,只是咱們的GBK編碼到當(dāng)時只編碼了中文字符和英文字符。

我們常說的8位16位值得就是比特位。都是以1024進(jìn)行計算的。

1bit-->1位二進(jìn)制
8bit=1Bytes(字節(jié))
1KB=1024Bytes
1MB=1024KB
1GB=1024MB
1TB=1024GB

程序員圈子有個梗,一個人找程序員朋友借1000元,程序員對他說:“要不湊個整吧!給你加24,湊個整?!?/p>

如果這個人不是程序員的話,可能會一臉懵逼。

但是做硬盤的廠商計算硬盤容量確是以1000進(jìn)行計算,所以我們買的500G硬盤它的實(shí)際容量只有四百六十多G。

而電信運(yùn)營商計算網(wǎng)速是以比特位進(jìn)行計算的,他們的單位叫Mbps,這個b是小寫的,就是兆比特每秒,意思是每秒傳輸?shù)亩M(jìn)制數(shù)的位數(shù)。

而我們常說的下載速度是MBps,這個B是大寫的,就是兆字節(jié)每秒,指的是每秒傳輸字節(jié)的數(shù)量。

1個字節(jié)=8個比特位,所以說我們用的100兆寬帶實(shí)際上的速度要除以8,在12兆多點(diǎn)的樣子。而且這還是排除干擾后的理想狀態(tài),實(shí)際多數(shù)情況下是達(dá)不到這個速度的。

由于一個字節(jié)等于8個比特位,所以我們會說Unicode里面是以2個字節(jié)來表示一個中文字符的,如果是比較生僻的字,會采用4個字節(jié)或者8個字節(jié)來表示。

對于現(xiàn)在的計算機(jī)來講,所有國家的人都可以在同一臺計算機(jī)里面,輸入自己國家的文字了。

未經(jīng)允許不得轉(zhuǎn)載:445IT之家 » Python Unicode編碼由來

贊 (0) 打賞

相關(guān)推薦

    暫無內(nèi)容!

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

微信掃一掃打賞