新版《信息技术 中文编码字符集》强制性国家标准发布
转自:教育部7月28日,国家标准化管理委员会、工业和信息化部、国家语言文字工作委员会在京联合召开《信息技术 中文编码字符集》(GB 18030-2022)强制性国家标准发布会。教育部党组成员、副部长、国家语委主任田学军,市场监管总局党组成员、副局长、国家标准委主任田世宏,工业和信息化部党组成员、副部长张云明出席会议并讲话。 田学军指出,《信息技术 中文编码字符集》是贯彻落实《国家通用语言文字法》、推动《通用规范汉字表》在社会各领域实施的重要举措,是坚定文化自信、促进中华优秀传统文化传承发展的切实需要,是坚持以人民为中心、为群众办实事的具体体现。十年来,语言文字战线深入贯彻落实习近平总书记关于教育和语言文化的重要论述及指示批示精神,认真贯彻党中央决策部署,砥砺奋进、开拓创新,推动语言文字事业取得跨越式发展和历史性成就。下一步,教育部、国家语委将进一步加强与有关部门的合作,协同推进《信息技术 中文编码字符集》标准的贯彻落实,共同推动语言文字事业高质量发展,为全面建成社会主义现代化强国贡献力量,以实际行动迎接党的二十大胜利召开。 《信息技术 中文编码字符集》是中文信息技术领域最重要的基础性标准,对汉字和我国多种少数民族文字统一编码,实施场景丰富,应用范围广泛。标准首次于2000年发布,2005年第一次修订。此次发布的新版标准是强制性国家标准,共收录汉字87887个,比上一版增收了1.7万余个生僻汉字,不仅收录《通用规范汉字表》全部汉字,同时覆盖我国绝大部分人名、地名用生僻字以及文献、科技等专业领域用字,为传承中华文化、增强中文信息处理能力、满足姓名生僻字人群用字需求提供标准保障。该标准将于2023年8月1日正式实施。 国务院办公厅、教育部、工业和信息化部、公安部、民政部、人力资源和社会保障部、中国人民银行、国家语言文字工作委员会、国家电子文件管理部际联席会议办公室、中国电子技术标准化研究院等有关单位参加会议。
标准在线查看
http://c.gb688.cn/bzgk/gb/showGb?type=online&hcno=A1931A578FE14957104988029B0833D3
本帖最后由 天堂雨 于 2023-6-26 22:10 编辑
GB 18030-2022汉字编码GB 18030-2022 具有几个鲜明的特点:汉字采用变长多字节编码,每个字可以由1个、2个或4个字节组成,最多可定义161万个字符;兼容 GB2312、GBK、GB 18030-2000或 GB 18030-2005 汉字编码和字符集;完全支持Unicode,支持CJK和emoji等字符;GB 18030在微软视窗系统Windows中的代码页为54936单字节: 0x00-0x7F双字节: 第一字节0x81-0xFE,第二个字节0x40-0x7E和0x80-0xFE四字节: 第一字节0x81-0xFE,第二字节0x30-0x39,第三字节0x81-0xFE,第四字节0x30-0x39 双字节区符号区
双字节1区首字节0xA1-0xA9尾字节0xA1-0xFE728
双字节5区首字节0xA8-0xA9尾字节0x40-0x7E和0x80-0xA0166
汉字区
双字节2区首字节0xB0-0xF7尾字节0xA1-0xFE6763
双字节3区首字节0x81-0xA0尾字节0x40-0x7E和0x80-0xFE6080
双字节4区首字节0xAA-0xFE尾字节0x40-0x7E和0x80-0xA08145
四字节区
0x81398B32-0x8139A135康熙部首214
0x8139EE39-0x82358738CJK统一汉字扩充A6530
0x82358F33-0x82359636CJK统一汉字66
0x95328236-0x9835F336CJK统一汉字扩充B42711
0x9835F738-0x98399E36CJK统一汉字扩充C4149
0x98399F38-0x9839B539CJK统一汉字扩充D222
0x9839B632-0x9933FE33CJK统一汉字扩充E5762
0x99348138-0x9939F730CJK统一汉字扩充F7473
学习学习 历史果然是螺旋前进的,和几十年前相比就差喊几句语录了! 《通用规范汉字表》汉字的GB18030-2022与UCS代码映射(部分)
国家标准《信息技术 中文编码字符集》 由339(工业和信息化部)归口 。
主要起草单位 中国电子技术标准化研究院 、北京北大方正电子有限公司 、北京亚细亚智业科技有限公司 、潍坊北大青鸟华光照排有限公司 、微软(中国)有限公司 。
主要起草人 陈壮 、陈恳 、黄疆 、吕建春 、樊毅 、陈晓研
基础信息
标准号: GB 18030-2022 标准类别: 基础
发布日期:2022-07-19 中国标准分类号:L71
实施日期:2023-08-01 国际标准分类好:35.040
全部代替标准:GB 18030-2005 归口部门:工业和信息化部
起草单位
中国电子技术标准化研究院
北京亚细亚智业科技有限公司
微软(中国)有限公司
北京北大方正电子有限公司
潍坊北大青鸟华光照排有限公司
起草人
陈壮陈恳樊毅陈晓研黄疆吕建春
参考:中文編碼網頁 → GB 18030 編碼表说明
本帖最后由 天堂雨 于 2023-6-28 00:21 编辑
原贴删除,见下一楼马老师回复
官方正式版下载:
https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=A1931A578FE14957104988029B0833D3 本帖最后由 天堂雨 于 2023-6-28 00:19 编辑
strnghrs 发表于 2023-6-27 09:42
官方正式版下载:
https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=A1931A578FE14957104988029B0833D ...
十分感谢马老师提供的下载信息.:):):)
查询国家市场监督管理总局令第25号《强制性国家标准管理办法》,第三十七条 规定国务院标准化行政主管部门应当自发布之日起二十日内在全国标准信息公共服务平台上免费公开强制性国家标准文本。
这个日后查看现在强制性国家标准文本就方便多了。
部分推荐性标准等无法直接下载,或版权限制等无法查看,还得从其他渠道获取标准全文。
下载的PDF采用了数字签名,无法直接编辑.
用马老师的pdgcnt编辑书签,基准页4,方便查看.
信息技术 中文编码字符集 -3
目次 -2
前言 -1
1范围 1
2规范性引用文件 1
3术语和定义 1
4字汇 2
4.1 概述 2
4.2 单字节部分 2
4.3 双字节部分 2
4.4 四字节部分 2
5总体结构 2
6字符的排列顺序 4
7码位分配 4
7.1单字节部分的码位分配 4
7.2双字节部分的码位分配 5
7.3四字节部分的码位分配 6
8 部分字符和代码的说明 7
9 实现的级别 7
9.2实现级别1 7
9.3实现级别2 7
9.4实现级别3 8
附录A (规范性) 双字节字符表 9
A.1 表的内容 9
A.2表的说明 9
示例如下: 9
双字节1区 10
双字节2区 13
双字节3区 37
双字节4区 53
双字节5区 82
双字节用户区1 83
双字节用户区2 85
双字节用户区3 88
附录B(规范性)表意文字描述符 91
表B.1表意文字描述符的图形、代码位置和功能描述 91
附录C(规范性) 四字节字符表 91
C.1表的内容 92
C.2表的说明 92
在四字节编码0x82358F33~0x82359636部分增加了CJK统一汉字新增的66个汉字(见附录C) 160
在四字节编码0x9835F738~0x98399E36 部分增加了CJK 统一汉字扩充C 的4149 个汉字(见附录C); 448
在四字节编码0x98399F38~0x9839B539部分增加了CJK 统一汉字扩充D 的222个汉字(见附录C); 468
在四字节编码0x9839B632~0x9933FE33 部分增加了CJK 统一汉字扩充E 的5762 个汉字(见附录C); 469
在四字节编码0x99348138~0x9939F730部分增加了CJK 统一汉字扩充F的7473个汉字(见附录C); 497
在四字节编码0x81398B32~0x8139A035部分增加了康熙部首214个(见附录C); 125
在四字节编码0x8134F932~0x81358437部分增加了83个西双版纳新傣文字符(见附录C); 111
在四字节编码0x81358B32~0x81359933部分增加了127个西双版纳老傣文字符(见附录C); 112
在四字节编码0x82369535~0x82369A32部分增加了48个傈僳文字符(见附录C); 166
在四字节编码0x9034C538~0x9034C730部分增加了13个蒙古文BIRGA 符号(见附录C); 243
在四字节编码0x9232C636~0x9232D635部分增加了149个滇东北苗文字符(见附录C); 244
附录D(资料性) 部分字符和代码的说明 546
D.1调整过的18个GB/T 13000代码位置 546
D.2在双字节区删除的6个汉字构件 547
D.3在双字节区删除的9个CJK兼容汉字 547
附录E(资料性) 《通用规范汉字表》汉字的代码位 549
这真是个好消息。去年没看到这个新闻。去年的7月、8月有事,一直没看新闻,漏掉了这么美好的消息。 感谢分享,下载学习下。
页:
[1]