UTF-32编码解码

文本与Unicode码点转换

输入内容

字节格式:
十六进制

转换结果

工具概述

UTF-32编码解码在线工具是一款专业的字符编码转换工具,用于将文本与UTF-32码点之间进行相互转换。UTF-32是一种固定长度的Unicode编码方式,每个字符使用4字节表示,可以直接对应Unicode码点。

本工具支持将任意文本转换为Unicode码点序列(以十六进制、十进制或二进制格式显示),也可以将码点序列还原为文本。支持中文、英文、表情符号等所有Unicode字符。

UTF-32编码特点

  • 固定宽度:每个字符固定使用4字节
  • 直接映射:编码值等于Unicode码点值
  • 简单直观:字符与码点一一对应
  • 空间效率低:ASCII字符也需要4字节

使用示例

编码示例

  • A0x00000041 (ASCII字符)
  • 0x00004E2D (中文)
  • 😀0x0001F600 (emoji)

常见问题与回答

1. 什么是UTF-32?

UTF-32是Unicode的一种编码实现方式,每个字符固定使用32位(4字节)表示,编码值直接等于Unicode码点。

2. UTF-32和UTF-8、UTF-16有什么区别?

UTF-8是变长编码(1-4字节),UTF-16使用2或4字节,UTF-32固定使用4字节。UTF-32处理简单但空间效率低,较少用于实际存储和传输。

3. 为什么UTF-32不常用?

UTF-32每个字符占用4字节,对于ASCII文本空间浪费严重。相比UTF-8,同样的文本UTF-32会占用4倍空间。

4. UTF-32有什么优势?

UTF-32的主要优势是字符索引简单直接,第N个字符就在第N*4字节位置,适合需要频繁按索引访问字符的场景。

5. 什么是Unicode码点?

Unicode码点是Unicode标准为每个字符分配的唯一数字标识,范围从0到0x10FFFF。UTF-32直接存储这个码点值。

6. Unicode码点的范围是多少?

Unicode码点范围是0x0000到0x10FFFF,共1,114,112个码点。其中实际分配的字符约占其中一部分。