跳到主要内容
🚨 重要提示

本项目目前仍处于早期开发阶段,核心功能尚未完全实现,语法规范和工具链仍在持续完善中。

不同编程语言 / 操作系统的默认编码

编程语言 / 操作系统默认 Unicode 编码占用空间
(字节)
描述
Python 3UTF-324 byte固定长度编码
Java, JavaScript, C#, Swift
Windows NT
UTF-162 / 4 byte变长编码。
使用 2 字节 表示 BMP 字符,
使用 4 字节代理对 表示超出 BMP 的字符
Node.js, Go, PHP, Rust, Ruby, Perl
Unix, Linux, macOS
UTF-81 - 4 byte变长编码
C / C++无固定标准-可用 UTF-8、UTF-16、UTF-32
备注

Python 3 存储时使用内部编码,只有输入输出时,才转为 Unicode 编码。所以准确来说,Python 3 的默认 Unicode 编码应该是 “UTF-32 + 内部编码”