使用Java語言進行Unicode代理編程
早期 Java 版本使用 16 位 char 數據類型表示 Unicode 字符。這種設計方 法有時比較合理,因為所有 Unicode 字符擁有的值都小于 65,535 (0xFFFF), 可以通過 16 位表示。但是,Unicode 后來將最大值增加到 1,114,111 (0x10FFFF)。由于 16 位太小,不能表示 Unicode version 3.1 中的所有 Unicode 字符,32 位值 — 稱為碼位(code point) — 被用于 UTF-32 編碼模式。
但與 32 位值相比,16 位值的內存使用效率更高, 因此 Unicode 引入了一個種新設計方法來允許繼續使用 16 位值。UTF-16 中采 用的這種設計方法分配 1,024 值給 16 位高代理(high surrogate),將另外 的 1,024 值分配給 16 位低代理(low surrogate)。它使用一個高代理加上一 個低代理 — 一個代理對(surrogate pair) — 來表示 65,536 (0x10000) 和 1,114,111 (0x10FFFF) 之間的 1,048,576 (0x100000) 值 (1,024 和 1,024 的乘積)。
Java 1.5 保留了 char 類型的行為來表 示 UTF-16 值(以便兼容現有程序),它實現了碼位的概念來表示 UTF-32 值。這個擴展(根據 JSR 204:Unicode Supplementary Character Support 實現) 不需要記住 Unicode 碼位或轉換算法的準確值 — 但理解代理 API 的正 確用法很重要。
非常好我支持^.^
(1) 100%
不好我反對
(0) 0%
下載地址
使用Java語言進行Unicode代理編程下載
相關電子資料下載
- 一套java+ spring boot與 vue+ mysql技術開發的UWB高精度工廠人員定位全套系統源碼有 54
- Java開發者LLM實戰——使用LangChain4j構建本地RAG系統 336
- 從多線程設計模式到對 CompletableFuture 的應用 56
- java模式開發的一套制造云MES工廠管理系統成品源碼介紹 180
- Java語言、idea開發工具、MYSQL數據庫開發的UWB定位技術系統源碼 118
- Java 智慧工地監管平臺源碼 依托智慧工地平臺,滿足省、市級住建數據監管要求 234
- UWB室內外高精度一體化融合定位系統源碼 UWB技術定位系統應用場景 Java+Spring 147
- 基于java+單體服務 +?硬件(UWB定位基站、卡牌)技術架構開發的UWB室內定位系統 159
- java開發的一套多端展示:web端、saas端、家長端、教師端 132
- 一套java+ spring boot+與vue+ mysql技術開發的UWB高精度工廠人員定位全套系統源碼 398