Unicode是一种通用的字符编码标准,旨在为世界上所有脚本和语言中的每个字符提供一个唯一的数值标识,称为代码点(code point)。它包含了几乎所有已知的语言、符号、标点符号、技术符号等字符。
Unicode的目标是解决以前存在的字符编码问题,因为不同的编码方案之间存在互不兼容的情况。在过去,不同的编码标准(如ASCII、ISO 8859等)只能表示特定范围的字符,无法满足全球范围内的字符需求。
Unicode使用十六进制数值表示每个字符的代码点,例如,拉丁字母大写字母'A'的代码点是U+0041,希腊字母大写字母'Ω'的代码点是U+03A9。Unicode标准定义了超过143,000个已分配的代码点,其中包括各种文字系统,如拉丁字母、希腊字母、西里尔字母、中日韩汉字、象形文字等。