亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 3860 | 回復: 8
打印 上一主題 下一主題

gbk utf8 unicode [復制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2007-10-13 09:46 |只看該作者 |倒序瀏覽
誰能給我解釋下這幾個的關系,困惑很久,google也沒發(fā)現(xiàn)什么建設性的東西。
     假如我這有一組數(shù)據(jù)(文件路徑吧),人家告訴我一個編碼,可能是gbk,也可能是utf8,我都想轉(zhuǎn)成unicode,那么我該怎么解析它?
      
   (我這個問題問的可能也有點不太對,我對這些東西是在模糊)

論壇徽章:
0
2 [報告]
發(fā)表于 2007-10-13 10:05 |只看該作者
看看iconv函數(shù) 或者 glib的相關內(nèi)容

論壇徽章:
0
3 [報告]
發(fā)表于 2007-10-13 10:39 |只看該作者
unicode是一種字符與數(shù)值的對應關系表
UTF-XX 是unicode的表現(xiàn)形式,關注的是如何儲存與字符對應的數(shù)值。
其中廣泛應用的utf-8編碼 避免了null字符的出現(xiàn),能兼容老系統(tǒng)及C字串操作函數(shù),成為最流行的unicode表現(xiàn)方式。
gb2312 -> gbk -> gb18030 主要是國內(nèi)的標準
gb2312只含幾千簡體字,gbk與gb18030都擴展了兩個字節(jié)的取值范圍,包含了大多數(shù)簡繁體漢字及中日韓字體,其中gb18030有四字節(jié)編碼。

編碼間的轉(zhuǎn)換只能通過映射表解決,在漢字三大系列編碼(gb, big5, unicode)中都沒有一一對應排列關系。

個人認識,錯誤風險自擔

[ 本帖最后由 nully 于 2007-10-13 10:40 編輯 ]

論壇徽章:
0
4 [報告]
發(fā)表于 2007-10-13 10:51 |只看該作者
gb2312 -> gbk -> gb18030 主要是國內(nèi)的標準


請問,gb2312 也能靠string來保存么?

論壇徽章:
0
5 [報告]
發(fā)表于 2007-10-13 10:56 |只看該作者
可以吧,雖然是多字節(jié)的。只是用幾(兩)個char來表示一個漢字,當用進行編碼轉(zhuǎn)換的時候,指定源文字編碼,iconv就會自動識別(個人是這么覺得)

論壇徽章:
0
6 [報告]
發(fā)表于 2007-10-13 12:43 |只看該作者
Font 1-> code point ->map to font 2.

論壇徽章:
0
7 [報告]
發(fā)表于 2007-10-13 13:25 |只看該作者
那GBK這類東西和什么有關呢?
例如我本地locale是阿拉伯的,我在
printf("中國\n");還能輸出么?

論壇徽章:
0
8 [報告]
發(fā)表于 2007-10-13 13:37 |只看該作者
張孝祥的java教程中有一章節(jié)對這個講得很詳細. 不過我平時也很少用到.

論壇徽章:
0
9 [報告]
發(fā)表于 2007-10-13 18:17 |只看該作者
好的我看看,多謝樓上各位兄臺
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP