本文目录索引 1,一个汉字对应的编码有哪几种,个有什么作用 2,汉字字形编码有哪两种类型?各有什么特点? 3,什么是汉字编码?汉字国标码和汉字区位码有何不同 4,汉字编码按编码方法不同,可分为哪四大类 5,汉字分为那四大类? 6,汉字按其编码可分为几类
本文目录索引
- 1,一个汉字对应的编码有哪几种,个有什么作用
- 2,汉字字形编码有哪两种类型?各有什么特点?
- 3,什么是汉字编码?汉字国标码和汉字区位码有何不同
- 4,汉字编码按编码方法不同,可分为哪四大类
- 5,汉字分为那四大类?
- 6,汉字按其编码可分为几类?各是什么。
- 7,汉字编码是什么意思
- 8,汉字编码有哪些类型,各有什么特点
- 9,汉字涉及到几种编码
- 10,ASCII编码和汉字编码有什么关系。
1,一个汉字对应的编码有哪几种,个有什么作用
汉字信息处理系统一般包括编码、输入、存储、编辑、输出和传输.编码是关键.不解决这个问题,汉字就不能进入计算机.
汉字进入计算机的三种途径 分别为:
①机器自动识别汉字:计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字.
②通过语音识别输入:计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字.
③通过汉字编码输入:根据一定的编码方法,由人借助输入设备将汉字输入计算机.
机器自动识别汉字和汉语语音识别,国内外都在研究,虽然取得了不少进展,但由于难度大,预计还要经过相当一段时间才能得到解决.在现阶段,比较现实的就是通过汉字编码方法使汉字进入计算机.
汉字编码的困难点 汉字进入计
2,汉字字形编码有哪两种类型?各有什么特点?
汉字编码分为外码、交换码、机内码和字形码。具体特点如下: 外码也叫输入码,规则简单、易学好记、操作方便、重码率低、输入速度快等优点,每个人可根据自己的需要进行选择。 机内码,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。 交换码(国标码),二进制代码使用起来是不方便的,于是需要采用信息交换码。中国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码。 字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。通常用16×16点阵来显示汉字。 Hanzi bianma汉字编码(Chinese character encoding )是为汉字设计的一种便于输入计算机的代码。由于电子计算机现有的输入键盘与英文打字机键盘完全兼容。因而如何输入非拉丁字母的文字(包括汉字)便成了多年来人们研究的课题。 汉字信息处理系统一般包括编码、输入、存储、编辑、输出和传输。编码是关键。不解决这个问题,汉字就不能进入计算机。 汉字编码的困难点 汉字进入计算机,有许多困难,其原因主要有三点,具体如下: 数量庞大:一般认为,汉字总数已超过6万个(包括简化字)。虽有研究者主张规定3000多或4000字作为当代通用汉字,但仍比处理由二三十个字母组成的拼音文字要困难得多。 字形复杂:有古体今体,繁体简体,正体异体;而且笔画相差悬殊,少的一笔,多的达36笔,简化后平均为9.8笔。 存在大量一音多字和一字多音的现象:汉语音节416个,分声调后为1295个(根据《现代汉语词典》统计,轻声39个未计)。以1万个汉字计算,每个不带调的音节平均超过24个汉字,每个带调音节平均超过7.7个汉字。有的同音同调字多达66个。一字多音现象也很普遍。
3,什么是汉字编码?汉字国标码和汉字区位码有何不同
1.【国标码】指国家标准汉字编码。即《信息交换用汉字编码字符集(基本集)》,简称GB-2312。该字符集有汉字6763个。设有94个区,每个区94个位。每个汉字有一个固定的区位。因此,区位码也可认为是国标码。
2.【区位码】区位码与国标码的区别在于,在GB-2312中预留了一些空位,便于补充和扩展,经过扩展的区位码字符数量及范围就超过了GB-2312。而且台湾、香港、及日韩也是用区位码的,但其区位号与大陆用的就完全不相同。
3.【机内码】为了避免ASCII码和国标码同时使用时产生两义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。
4,汉字编码按编码方法不同,可分为哪四大类
汉字编码主要分为四大类:汉字输入码、汉字交换码、汉字内码和汉字字形码。
(1)汉字的外部码
汉字的外部码简称外码,又叫输人码,是输人汉字的一组键盘符号。使用不同的输入方法,同一汉字的外部码不同。用户应选用易记忆、操作简单、位码少、重码少和输人速度快的外码。
(2)汉字的内部码
汉字的内部码又称汉字内码或汉字机内码。机器接收到外码后,要转换成内码进行存储、运算和传送。用二个字节表示汉字的内码。为了和西文符号区分,内码的最高位设为“1”。内码通常用汉字在车库中的物理位置表示,可以是汉字在字库中的序号,也可以是字库中的存储位置。
(3)汉字交换码
在计算机之间交换信息时,要求传送的汉字代码符合国家规定的交换码标准,即符合GB2312-80信息交换用汉字编码集,又称为国标码。国标码收集了7445个图形字符,其中有6763个汉字和各种符号709个。
国标码规定,每个汉字用两个字节表示,每个字节仅用低7位,最高位为0。汉字的国标码和内码有—一对应关系,即将高位加l,国标码就变为内码。
(4)汉字字形码
在显示或打印汉字时,还涉及到字形码,又称输出码。汉字字形是指原来铅字排版汉字的大小和形状,在计算机中指组成汉字的点阵。尽管汉字字形有多种变化,笔画繁简不一,但都是方块字且大小相同,都可以写在同样的方块中。把一个方块看成m行n列矩阵,共有m×n个点,称为汉字点阵。如16×16点阵的汉字,共有256个点
汉字点阵和字形的对应关系是,有笔画处的点为1,无笔画处的点为0。这样,汉字的点阵可以对应若干字节长的字形码。这种表示汉字点阵的方法称为汉字字形的数字化表示法。
5,汉字分为那四大类?
汉字编码按编码方法不同,可分为:流水码、拼音码、拼形码、音形结合码四大类.
汉字按结构分有3类,象
形
法
这
是
形
成
汉
字
的
最
早
方
法,
因
此
创
造
了
最
原
始
的
文
字,
例:
“日”
写
成
,
“月”
写
成
,
水
写
成
,
牛
写
成
等
等。
这
些
象
形
字
经
过
逐
渐的
演
变,
到
后
来
都
改
变
了
原
字
的
形
体,
变
成
了
后
来
方
正
的
字
体,
有
的
笔
画
减
少
了,
有
的
笔
画
增
添
了,
由
不
规
则
变
成
了
有
规
则
的
字
体。
会
意
法
象
形
字
比
较
容
易
看
出
造
字
的
道
理,
但
它
们
不
能
表
达
抽
象
的
意
思。
古
人
便
创
造
了
另
一
种
造
字
法
——
会
意
法。
就
是
用
不
同
的
符
号
或
借
用
“象
形
字”
加
上
一
些
符
号
来
表
达
一
个
抽
象
的
意
思。
例:
“明”
字
写
成
,
意
为
“日”
和
“月”
带
来
光
明。
“旦”
字
写
成
,
(意
为太
阳
出
地
平
线
而
升
起。
形
声
法
象
形
字
和
会
意
字
都
能
从
字
形
上
看
出
字
的
意
义,
但
却
不
能
读
出
声
音。
因
此
又
创
造
了
形
声
法
来
造
字。
把
表
示
声
音
的
声
旁
和
表
示
意
义
的
形
旁
搭
配
起
来,
组
成
很
多
新
字。
例:
“爸”
字
是
表
音
的
“巴”
字
和
表
形
的
“父”
字
的
结
合;
“
芭
”
字
是
由
“巴”
和“++”
搭
配
而
成。
这
样
文
字
越
造
越
多,
据
统
计,
形
声
字
占
汉
字
的
90%
左
右。
汉
字
的
形
成
和
发
展,
成
为
人
们
交
流
思
想
的
重
要
工
具,
适
应
了
人
类
社
会
生
活
的
需
要。
6,汉字按其编码可分为几类?各是什么。
据粗略统计,现有400多种编码方案,其中上机通过试验的和已被采用作为输入方式的也有数十种之多。归纳起来,不外5种类型: ①整字输入法:前一阶段,一般是将三四千个常用汉字排列在一个具有三四百个键位的大键盘上。近来,大多是将这些汉字按XY坐标排列在一张字表上,通常叫“字表法”,或“笔触字表法”。比如,X25行和Y90列交叉的字为“国”,当电笔点到字表上的“国”字时,机器自动将该字的代码2590输入。键盘上或字表中字按部首或按音序或按字义联想而排列。不常用的字作为盘外字或表外字,另行编码处理。 ②字形分解法:将汉字的形体分解成笔画或部件,按一定顺序输进机器。笔画一般分成 8种:横(一)、竖(丨)、撇(丿)、点(丶)、折(□)、弯(□)、叉(十)、方(口)。部件一般归纳出一二百个。由于一般键盘上只有42个键(包括数字和标点),容纳不下这么多部件,因而有人设计中键盘,也有人利用部件形体上的相似点或出现概率的不同,而把100多个部件分布在26个字母键上。 ③字形为主、字音为辅的编码法:这种编码法与字形分解法的不同在于还要利用某些字音信息。如有的方案为了简化编码规则,缩短码长,在字形码上附加字音码,有的方案为了采用标准英文电传机,将分解归纳出来的字素通过关系字的读音转化为拉丁字母。 ④全拼音输入法:绝大多数是以现行的汉语拼音方案为基础进行设计。关键问题是区分同音字,因而有的方案提出“以词定字”的方法,还有的方案提出“拼音-汉字转换法”,即“汉语拼音输入 ——机内软件变换(实为查机器词表)——汉字输出”系统。 ⑤拼音为主、字形为辅的编码法:一般在拼音码前面或后面再添加一些字形码。拼音码有用现行汉语拼音方案或稍加简化的,还有的为了缩短码长而把声母和韵母都用单字母或单字键表示的“双拼方案”或“双打方案”。如F键既表声母F,又表韵母ang,连击两下,便是Fang“方”字。区分同音字的字形码也多种多样。除了大部分采用偏旁部首的信息外,还有采用起末笔或采用语义类别的。 上述各种编码法,各有短长。例如,字表法的特点是一字一格(键),无重码,直观性好,操作简单。缺点是需特制键盘,速度较慢。字形分解法的好处是按形取码,不涉及字音,因而不认识的字(包括生僻字、古字)也同样可以编码输入;但汉字形体结构非常复杂,写法也有许多差异,分解标准不易统一,因而不少方案规则较多。拼音输入法(包括拼音-汉字转换法)的优点是操作简捷,可以“盲打”,不受汉字简化、字形改变的影响,符合拼音化方向,并且还便于作进一步信息处理;缺点是不认识的字无法输入;另外,如果不加字形码或不用以词定字法或显式选择法,同音字较难处理。
7,汉字编码是什么意思
汉字编码Chinese character encoding 为汉字设计的一种便于输入计算机的代码。由于电子计算机现有的输入键盘与英文打字机键盘完全兼容。因而如何输入非拉丁字母的文字(包括汉字)便成了多年来人们研究的课题。 汉字信息处理系统一般包括编码、输入、存储、编辑、输出和传输。编码是关键。不解决这个问题,汉字就不能进入计算机。
8,汉字编码有哪些类型,各有什么特点
汉字编码有五种类型,分别是整字输入法、字形分解法、字形为主字音为辅的编码法、拼音为主字形为辅的编码法、全拼音输入法。具体特点如下: 1、整字输入法 将三四千个常用汉字排列在一个具有三四百个键位的大键盘上;一字一格(键),无重码,直观性好,操作简单;但需特制键盘,速度较慢。 2、字形分解法 汉字的形体分解成笔画或部件,按一定顺序输进机器;按形取码,不涉及字音,因而不认识的字也同样可以编码输入;汉字形体结构非常复杂,写法也有许多差异,分解标准不易统一。 3、字形为主、字音为辅的编码法 要利用某些字音信息,如有的方案为了简化编码规则,缩短码长,在字形码上附加字音码;有的方案为了采用标准英文电传机,将分解归纳出来的字素通过关系字的读音转化为拉丁字母。 4、全拼音输入法 以现行的汉语拼音方案为基础进行设计;操作简捷,可以“盲打”,不受汉字简化、字形改变的影响,符合拼音化方向,并且还便于作进一步信息处理。 5、拼音为主、字形为辅的编码法 在拼音码前面或后面再添加一些字形码,拼音码有用现行汉语拼音方案或稍加简化的,还有的为了缩短码长而把声母和韵母都用单字母或单字键表示的“双拼方案”或“双打方案”;除了大部分采用偏旁部首的信息外,还有采用起末笔或采用语义类别的。 扩展资料: 定型标准 1、定型化 编码方案的定型化,即一般所说的选优工作,对计算机的普及应用非常重要。当然,定型或选优并不意味着只定一种或只选一种,而要照顾到多种用户的需要。 2、标准化 1981年,国家标准局公布了《信息交换用汉字编码字符集基本集》(简称汉字标准交换码),共分两级,一级3755个字,二级3008个字,共6763个字。这种汉字标准交换码可以为各种输入输出设备的设计提供统一的标准,使各种系统之间的信息交换有共同一致性。 参考资料来源:百度百科-汉字编码
9,汉字涉及到几种编码
汉字在计算机上的编码主要有三种:输入码、机,内码和输出码,1.用于输入的汉字的编码——输入码(外码) 计算机上输入汉字的方法很多,如键盘编码输入、语音输入、手写输入、扫描输入等,其中键盘编码输入是最容易实现和最常用的一种汉字输入方法。英文等可以用键盘上的每个字母键来输入,而输入汉字则不同,不可能用有限的按键来对应每一个汉字,为了让用户能直接使用英文键盘输入汉字,于是就有了输入汉字时使用的汉字输入码,它一般由键盘上的字母或数字组成,代表某个汉字或某些汉字、词组或句子。当前用于汉字输入的编码方案很多,如区位码、拼音码、王码(五笔字型)、自然码等。 2.用于储存汉字的编码——机内码(内码) 由于汉字输入码的编码方案多种多样,同一个汉字如果采用的编码方案不一样,其输入码就有可能不一样。如果计算机内部存放的是汉字输入码本身,就会造成相同汉字在机内可以用不同的编码表示,这样显然不合理,也给计算机内部的汉字处理增加了难度。为了将汉字的各种输入码在计算机内部统一起来,就引进了汉字的机内码。 3.用于输出汉字的编码——输出码(字型码) 存储在计算机内的汉字在屏幕上显示或在打印机上打印出来时,必须以汉字字形输出,才能被人们所接受和理解。汉字的输出码实际上是汉字的字型码,它是由汉字的字模信息所组成的。汉字是一种象形文字,每个汉字东可以看成一个特定的图形,这种图形可以用点阵、向量等方式表示,而最基本的是用点阵表示。所谓点阵方式,就是将汉字分解成由若干个“点”??组成的点阵字型,将此点阵字型至于网状方格上,每个方各试点阵中的一个“点”。
10,ASCII编码和汉字编码有什么关系。
ASCII码占一个字节,汉字不是用ASCII码编码的,一般有GBK2312和UTF-8等编码方式,他们都占2个字节。 每个键盘上的键值及字符 在ASC码中都有一个对应,而每个汉字由2个ASC码对应。首字节高位是1的,可能是汉字编码,或者反过来说,汉字编码两个字节的高位为1。ASCII高位为0。 汉字编码范围(GB2312),第一字节 第二字节,0xB0-0xF7(176-247) 0xA0-0xFE(160-254) ascll码范围 0-127,可以看出对于汉字,无论第一个字节还是第二个字节,第一位都是1而ascll码的第一位是0。
下一篇:没有了