HTML 字符集


要正确显示HTML页面,Web浏览器必须知道使用何种字符集(字符编码)。


什么是字符编码?

ASCII是第一个字符编码标准 (也称为字符集)。 ASCII定义了可在互联网上使用的128种不同的字母数字字符:数字(0-9),英文字母(A-Z)和一些特殊字符,如! $ + - ()@ <>。

ANSI(Windows-1252)是原始的Windows字符集,支持256种不同的字符代码。

ISO-8859-1是HTML 4的默认字符集。此字符集还支持256种不同的字符代码。

由于ANSI和ISO-8859-1非常有限,HTML 4也支持UTF-8。

UTF-8(Unicode)几乎涵盖了世界上所有的字符和符号。

HTML5的默认字符编码是UTF-8。


HTML charset属性

要正确显示HTML页面,Web浏览器首先要知道页面中使用的是什么字符集。

这在<meta>标记中指定:

对于HTML4:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

对于HTML5:

<meta charset="UTF-8">

如果浏览器在网页中检测到ISO-8859-1,则默认为ANSI,因为ANSI与ISO-8859-1相同,只是ANSI有32个额外字符。



字符集之间的差异

下表显示了上述字符集之间的差异:

编号 ASCII ANSI 8859 UTF-8 描述
32



空格
33!!!!感叹号
34""""引号
35####数字符号
36$$$$美元符号
37%%%%百分号
38&&&&符号
39''''撇号
40((((左括号
41))))右括号
42****星号
43++++加号
44,,,,逗号
45----连字符-减号
46....句号
47////斜杠
480000数字零
491111数字一
502222数字二
513333数字三
524444数字四
535555数字五
546666数字六
557777数字七
568888数字八
579999数字九
58::::冒号
59;;;;分号
60<<<<小于号
61====等于号
62>>>>大于号
63????问号
64@@@@艾特(at)
65AAAA拉丁文大写字母 A
66BBBB拉丁文大写字母 B
67CCCC拉丁文大写字母 C
68DDDD拉丁文大写字母 D
69EEEE拉丁文大写字母 E
70FFFF拉丁文大写字母 F
71GGGG拉丁文大写字母 G
72HHHH拉丁文大写字母 H
73IIII拉丁文大写字母 I
74JJJJ拉丁文大写字母 J
75KKKK拉丁文大写字母 K
76LLLL拉丁文大写字母 L
77MMMM拉丁文大写字母 M
78NNNN拉丁文大写字母 N
79OOOO拉丁文大写字母 O
80PPPP拉丁文大写字母 P
81QQQQ拉丁文大写字母 Q
82RRRR拉丁文大写字母 R
83SSSS拉丁文大写字母 S
84TTTT拉丁文大写字母 T
85UUUU拉丁文大写字母 U
86VVVV拉丁文大写字母 V
87WWWW拉丁文大写字母 W
88XXXX拉丁文大写字母 X
89YYYY拉丁文大写字母 Y
90ZZZZ拉丁文大写字母 Z
91[[[[左方括号
92反向斜杠
93]]]]右方括号
94^^^^抑扬符
95____低线
96````重音符
97aaaa拉丁文小写字母 a
98bbbb拉丁文小写字母 b
99cccc拉丁文小写字母 c
100dddd拉丁文小写字母 d
101eeee拉丁文小写字母 e
102ffff拉丁文小写字母 f
103gggg拉丁文小写字母 g
104hhhh拉丁文小写字母 h
105iiii拉丁文小写字母 i
106jjjj拉丁文小写字母 j
107kkkk拉丁文小写字母 k
108llll拉丁文小写字母 l
109mmmm拉丁文小写字母 m
110nnnn拉丁文小写字母 n
111oooo拉丁文小写字母 o
112pppp拉丁文小写字母 p
113qqqq拉丁文小写字母 q
114rrrr拉丁文小写字母 r
115ssss拉丁文小写字母 s
116tttt拉丁文小写字母 t
117uuuu拉丁文小写字母 u
118vvvv拉丁文小写字母 v
119wwww拉丁文小写字母 w
120xxxx拉丁文小写字母 x
121yyyy拉丁文小写字母 y
122zzzz拉丁文小写字母 z
123{{{{左括号
124||||垂线
125}}}}右大括号
126~~~~波浪号
127DEL    
128   欧元符号
129 NOT USED
130   单低-9引号
131 ƒ  带钩的拉丁小写字母f
132   双低-9引号
133   水平省略号
134   匕首
135   双匕首
136 ˆ  修饰符字母抑扬符
137   每千米标志
138 Š  拉丁大写字母S与卡隆
139   单个左指角引号
140 Œ  拉丁语资本结合OE
141 NOT USED
142 Ž  拉丁大写字母Z与卡隆
143 NOT USED
144 NOT USED
145   左下单引号
146   右下单引号
147   左双单引号
148   右双单引号
149   着重号
150   连接号,长度等于大写字母N
151   长度等于大写字母M
152 ˜  小波浪
153   商标标志
154 š  拉丁文小写字母 s 与卡隆
155   单右指角引号
156 œ  拉丁小结扎oe
157 NOT USED
158 ž  拉丁小写字母z与卡隆
159 Ÿ  带有分音符的拉丁大写字母Y
160    不间断的空格
161 ¡¡¡倒置的感叹号
162 ¢¢¢分号
163 £££英镑符号
164 ¤¤¤货币符号
165 ¥¥¥日元符号
166 ¦¦¦竖杠
167 §§§管界标
168 ¨¨¨分音符号
169 ©©©版权标志
170 ªªª女性序数指标
171 «««左指双角引号
172 ¬¬¬不签字
173 ­­­软连字符
174 ®®®注册的标志
175 ¯¯¯长音符号
176 °°°学位标志
177 ±±±加减号
178 ²²²上标二
179 ³³³上标三
180 ´´´重音符
181 µµµ微标志
182 pilcrow标志
183 ···中间点
184 ¸¸¸变音符号
185 ¹¹¹上标一
186 ººº男性序数指标
187 »»»右指双角引号
188 ¼¼¼分数四分之一
189 ½½½一半
190 ¾¾¾分数四分之三
191 ¿¿¿倒置的问号
192 ÀÀÀ拉丁文大写字母 A with grave
193 ÁÁÁ拉丁文大写字母 A with acute
194 ÂÂÂ拉丁文大写字母 A with circumflex
195 ÃÃÃ拉丁文大写字母 A with tilde
196 ÄÄÄ拉丁文大写字母 A with diaeresis
197 ÅÅÅ拉丁文大写字母 A with ring above
198 ÆÆÆ拉丁文大写字母 AE
199 ÇÇÇ拉丁文大写字母 C with cedilla
200 ÈÈÈ拉丁文大写字母 E with grave
201 ÉÉÉ拉丁文大写字母 E with acute
202 ÊÊÊ拉丁文大写字母 E with circumflex
203 ËËË拉丁文大写字母 E with diaeresis
204 ÌÌÌ拉丁文大写字母 I with grave
205 ÍÍÍ拉丁文大写字母 I with acute
206 ÎÎÎ拉丁文大写字母 I with circumflex
207 ÏÏÏ拉丁文大写字母 I with diaeresis
208 ÐÐÐ拉丁文大写字母 Eth
209 ÑÑÑ拉丁文大写字母 N with tilde
210 ÒÒÒ拉丁文大写字母 O with grave
211 ÓÓÓ拉丁文大写字母 O with acute
212 ÔÔÔ拉丁文大写字母 O with circumflex
213 ÕÕÕ拉丁文大写字母 O with tilde
214 ÖÖÖ拉丁文大写字母 O with diaeresis
215 ×××multiplication sign
216 ØØØ拉丁文大写字母 O with stroke
217 ÙÙÙ拉丁文大写字母 U with grave
218 ÚÚÚ拉丁文大写字母 U with acute
219 ÛÛÛ拉丁文大写字母 U with circumflex
220 ÜÜÜ拉丁文大写字母 U with diaeresis
221 ÝÝÝ拉丁文大写字母 Y with acute
222 ÞÞÞ拉丁文大写字母 Thorn
223 ßßß拉丁文小写字母 sharp s
224 ààà拉丁文小写字母 a with grave
225 ááá拉丁文小写字母 a with acute
226 âââ拉丁文小写字母 a with circumflex
227 ããã拉丁文小写字母 a with tilde
228 äää拉丁文小写字母 a with diaeresis
229 ååå拉丁文小写字母 a with ring above
230 æææ拉丁文小写字母 ae
231 ççç拉丁文小写字母 c with cedilla
232 èèè拉丁文小写字母 e with grave
233 ééé拉丁文小写字母 e with acute
234 êêê拉丁文小写字母 e with circumflex
235 ëëë拉丁文小写字母 e with diaeresis
236 ììì拉丁文小写字母 i with grave
237 ííí拉丁文小写字母 i with acute
238 îîî拉丁文小写字母 i with circumflex
239 ïïï拉丁文小写字母 i with diaeresis
240 ððð拉丁文小写字母 eth
241 ñññ拉丁文小写字母 n with tilde
242 òòò拉丁文小写字母 o with grave
243 óóó拉丁文小写字母 o with acute
244 ôôô拉丁文小写字母 o with circumflex
245 õõõ拉丁文小写字母 o with tilde
246 ööö拉丁文小写字母 o with diaeresis
247 ÷÷÷除法标志
248 øøø拉丁文小写字母 o with stroke
249 ùùù拉丁文小写字母 u with grave
250 úúú拉丁文小写字母 u with acute
251 ûûû拉丁文小写字母 with circumflex
252 üüü拉丁文小写字母 u with diaeresis
253 ýýý拉丁文小写字母 y with acute
254 þþþ拉丁文小写字母 thorn
255 ÿÿÿ拉丁文小写字母 y with diaeresis

ASCII字符集

ASCII使用0到31(和127)的值作为控制字符。

ASCII对字母,数字和符号使用32到126之间的值。

ASCII不使用128到255之间的值。


ANSI字符集(Windows-1252)

对于0到127的值,ANSI与ASCII相同。

ANSI有一组专有字符,值为128到159。

对于160到255的值,ANSI与UTF-8相同。


ISO-8859-1字符集

对于0到127的值,8859-1与ASCII相同。

8859-1不使用128到159之间的值。

对于160到255的值,8859-1与UTF-8相同。


UTF-8字符集

对于0到127的值,UTF-8与ASCII相同。

UTF-8不使用128到159之间的值。

对于160到255的值,UTF-8与ANSI和8859-1相同。

UTF-8从值256继续,超过10 000个不同的字符。

如需进一步了解,请研究我们的完整HTML字符集参考


@charset CSS规则

您可以使用CSS @charset规则指定样式表中使用的字符编码:

实例

将样式表的编码设置为Unicode UTF-8:

@charset "UTF-8";

CSS参考文档 中阅读有关 CSS @charset 规则的更多信息。