五笔字型
五笔字型
五笔字型编码歌
五笔字型最直观,依照笔顺把码编;键名汉字打四下,基本字根请照搬;
一二三末取四杩,顺序拆分大优先;不足四码请注意,交叉识别补后边。
键名输入
各个键上的第一个码元,即“助记词”中打头的那个码元,我们称之为“键名”。这个作为“键名”的汉字,其输入方法是:把所在的键连打四下(不再打空格键),例:
王:王王王王 11 11 11 11 (G G G G)
又:又又又又 54 54 54 54 (C C C C)
如此,把每一个键都连打4下,即可输入25个作为键名的汉字。
成字码元输入
1成字码元:码元总表之中,键名以外自身也是汉字的码元谓之“成字码元”,简称“成码元”。除键名外,成码元一共有97个(其中包括相当于汉字的“氵、亻、勹、刂”等)。
2成码元的输入法:先打一下它所在的键(称之为“报户口”)再根据“码元拆成单笔画”的原则,打它的第一个单笔画、第二个单笔画以及其最后一个单笔画,不足4键时,加打一次空格键。现举例如下表:
成码元 报户口 第一单笔 第二单笔 最末单笔 所击键位
文 文(Y) 、(Y) 一(G) 、(Y) 41 41 11 41 YYGY
用 用(E) 丿(T) 乙(N) │(H) 33 31 51 21 ETNH
亻 亻(W) 丿(T) 丨(H) 34 31 21 WTH空格
厂 厂(D) 一(G) 丿(T) 13 11 31 DGT空格
车 车(L) 一(G) 乙(N) 丨(H) 24 11 51 21 LGNH
3单笔画输入:许多人不太注意,其实5种单笔“一、丨、丿、丶、乙”,在国家标准中都是作为汉字来对待的。在“五笔字型”中,照理说它们应当按照“成码元” 的方法输入,除“一”之外,其它几个都很不常用,按“成码元”的打法,它们的编码只有2码,这么简短的“码”用于如此不常用的“字”,真是太可惜了!于是,我们将其简短的编码让位给更常用的字,却人为地在其正常码的后边,加两个“L”作为5个单笔画的编码
例:一:GGLL 丨:HHLL
丿:TTLL 丶:YYLL
乙:NNLL
应当说明,“一”是一个极为常用的字,每次都打4下岂不慢事?别担心,后边会讲到,“一”还有一个“高频字”码,即打一个“G”再打一个空格便可输入。
“键外字”输入法
凡是“码元总表”上没有的汉字,即“键外字”,都可以认为是由表内的码元拼合而成的,故称之为“合体字”──相当于“分子”。按照前述汉字分解的总原则──“汉字拆成码元”。我们首先应毫不客气、毫无例外地将一切“合体字”拆成若干个码元
合体字的拆分原则
l 书写顺序:拆分“合体字”时,一定要按照正确的书写顺序进行。例:“新”只能拆成“立、木、斤”,不能拆成“立、斤、木” “中”只能拆成“口、丨”,不能拆成“丨、口”;“夷”只能拆成“一、弓、人”,不能拆成“大、弓”。
l 取大优先:“取大优先”,也叫做“优先取大”。按书写顺序拆分汉字时,应以“再添一个笔画便不能成其为码元”为限,每次都拆取一个“尽可能大”的,即尽可能笔画多的码元。例1:世:第一种拆法:一、凵、乙(误)第二种拆法:廿、乙(正)显然,前者是错误的,因为其第二个码元“凵”,完全可以向前“凑”到“一”上,形成一个“更大”的已知码元“廿”。例2:制:第一种拆法: 、一、冂、丨、刂(误)第二种拆法: 、冂、丨、刂(正)同样,第一种拆法是错误的。因为第二码的“一”,作为“ ”后一个笔画,全可以向前“凑”,与第一个码元“ ”凑成“更大”一点的码元“ ”。总之,“取大优先”,俗称“尽量往前凑”,是一个在汉字拆分中最常用到的基本原则。至于什么才算“大”,“大”到什么程度才到“边”,这要等熟悉了码元总表,便不会出错误了。
l 兼顾直观:在拆分汉字时,为了照顾汉字码元的完整性,有时不得不暂且牺牲一下“书写顺序”和“取大优先”的原则,形成个别例外的情况。例1:国:按“书写顺序”应拆成:“冂、王、丶、一”,但这样便破坏了汉字构造的直观性,故只好违背“书写顺序”,拆作“囗、王、丶”了。例2:自:按“取大优先”应拆成:“亻、乙、三”,但这样拆,不仅不直观,而且也有悖于“自”字的字源(这个字的字源是“一个手指指着鼻子”)故只能拆作“丿、目”,这叫做“兼顾直观”。
l 能连不交:请看以下拆分实例:于:一十(二者是相连的)、二丨(二者是相交的)丑:乙土(二者是相连的)、刀二(二者是相交的)。当一个字既可拆成相连的几个部分,也可拆成相交的几个部分时,我们认为“相连”的拆法是正确的。因为一般来说,“连”比“交”更为“直观”。
l 能散不连:
. 笔画和码元之间,码元与码元之间的关系,可以分为“散”、“连”和“交”的三种关系。如:倡:三个码元之间是“散”的关系;自:首笔“丿”与“目”之间是“连”的关系;夷:“一”、“弓”与“人”是“交”的关系。
. 码元之间的关系,决定了汉字的字型(上下、左右、杂合)。
(a)几个码元都“交”“连”在一起的,如“夷”、“丙”等,便肯定是“杂合型”,属于“3”型字,不会有争议。而散根结构必定是“1”型或“2”型字。
(b)值得注意的是,有时候一个汉字被拆成的几个部分都是复笔码元(不是单笔画),它们之间的关系,在“散”和“连”之间模棱两可。如:占:卜口两者按“连”处理,便是杂合型(3型)。两者按“散”处理,便是上下型(2型正确)。严:一厂后两者按“连”处理,便是杂合型(3型)后两者按“散”处理,便是上下型(2型正确)。当遇到这种既能“散”,又能“连”的情况时.我们规定:只要不是单笔画,一律按“能散不连”判别之。因此,以上两例中的“占”和“严”,都被认为是“上下型”字(2型)。
(c)作为以上这些规定,是为了保证编码体系的严整性。实际上,用得上后三条规定的字只是极少数。
“多根字”的取码规则
所谓“多根字”,是指按照规定拆分之后,总数多于4个码元的字。这种字,不管拆出了几个码元,我们只按顺序取其第一、二、三及最末一个码元,俗称“一二三末”,共取四个码。如:戆:立早夂心42、22、31、51(UJTN)
“四根字”的取码规则
“四根字”是指刚好由四个码元构成的字,其取码方法是依照书写顺序把四个码元取完。如:照:日刀口灬22、53、23、44(JVKO);低:亻 七丶 34 35 15 41(WQAY)
不足四根字的取码规则
当一个字拆不够4个码元时,它的输入编码是:先打完码元码,再追加一个“末笔字型识别码”,简称“识别码”。
1、“识别码”的组成:它是由“末笔”代号加“字型”代号而构成的一个附加码。由于教不得法,以前许多人对“识别码”望而生畏。其实,按如下做法,你只要5分钟定能学会:
l “1”型(左右型)字:码元打完之后,补打1个末笔画即等同于加了“识别码”。例:
沐:氵木丶(“丶”为末笔,补1个“丶”)汀:氵丁丨(“丨”为末笔,补1个“丨”)洒:氵西一(“一”为末笔,补1个“一”)
l “2”型(上下型)字:码元打完之后,补打由2个末笔画复合构成的“码元”即等同于加了“识别码”。例:华:亻匕十(末笔为“丨”,2型,补打“刂”作为“识别码”)字:宀子二(末笔为“一”,2型,补打“二”作为“识别码”)参:厶大彡(末笔为“丿”,2型,补打“ ”作为“识别码”)
l “3”型(杂合型)字:码元打完之后,补打由3个末笔画复合而成的“码元”即等同于加了“识别码”。例:同:冂一口三(末笔为“一”,3型,补打“三”作为“识别码”)串:口口丨(末笔为“丨”,3型,补打“川”作为“识别码”)国:囗王丶氵(末笔为“丶”,3型,补打“氵”作为“识别码”)至于为什么这些“笔画”可以起到“识别码”的作用,你只要仔细研究一下区位号的设计与“识别码”的定义便会恍然大悟。
2、关于“末笔”的几项说明:
l 关于“力、刀、九、匕”。鉴于这些码元的笔顺常常因人而异,“五笔字型”中特别规定,当它们参加“识别”时,一律以其“伸”得最长的“折”笔作为末笔。如:男:田力(末笔为“乙”,2型)花:艹亻匕(末笔为“乙”,2型)
l 带“框框”的“国、团”与带走之的“进、远、延”等,因为是一个部分被另一个部分包围,我们规定:视被包围部分的“末笔”为“末笔”。如:进:二刂辶(末笔“丨”3型,加“川”作为“识别码”)远:二儿辶巛(末笔“乙”3型,加“巛”作为“识别码”)团:囗十丿彡(末笔“丿”3型,加“彡”作为“识别码”)哉:十戈口三(末笔“一”3型,加“三”作为“识别码”)
l “我”“戋”“成”等字的“末笔”,由于因人而异,故遵从“从上到下”的原则,一律规定撇“丿”为其末笔。如:我:丿扌乙丿(TRNT,取一二三末,只取4码)戋:戋一一丿(GGGT,成码元,先“报户口”再取1、2、末笔)成:厂乙乙丿(DNNT,取一二三末,只取4码)
l 单独点:对于“义、太、勺”等字中的“单独点”,离码元的距离很难确定,可远可近,我们干脆认为这种“单独点”与其附近的码元是“相连”的。既然“连”在一起,便属于杂合型(3型)。其中“义”的笔顺,还需按上述“从上到下”的原则,认为是“先点后撇”。如:义:丶 氵(末笔为“丶”3型,“氵”即为识别码)太:大丶氵(末笔为“丶”3型,“氵”即为识别码)勺:勹丶氵(末笔为“丶”3型,“氵”即为识别码)
词语的编码规则
1982年底,“五笔字型”首创了汉字的词语,依形编码、字码词码体例一致、不须换档的实用化词语输入法。不管多长的词语,一律取四码。而且单字和词语可以混合输入,不用换挡或其它附加操作,谓之“字词兼容”。其取码方法为:
l 两字词:每字取其全码的前两码组成,共四码。如:
经济:纟又 氵 文(55 54 43 41 XCIY)
操作:扌口 亻 (32 23 34 31 RKWT)
l 三字词:前两字各取一码,最后一字取两码,共四码。如:
计算机:讠竹木几(41 31 14 25 YT***)
操作员:扌亻口贝(32 34 23 25 RWKM)
l 四字词:每字各取全码的第一码。如:
科学技术:禾 扌木(31 43 32 14 TIRS)
汉字编码:氵宀 纟石(43 45 55 13 I***D)
王码电脑:王石曰月(11 13 22 33 GDJE)
l 多字词:取第一、二、三及末一个汉字的第一码,共四码。如:
电子计算机:曰子讠木(22 52 41 14 JBYS)
中华人民共和国:口亻人囗(23 34 34 24 KWWL)
美利坚合众国: 禾 囗(42 31 22 24 UTJL)
五笔字型计算机汉字输入技术:五竹 木(11 31 11 14 GTGS)
注意:在WINDOWS版王码汉字操作系统中,系统为用户提供了15000条常用词组,此外,用户还可以使用系统提供的造词软件另造新词,或直接在编辑文本的过程中从屏幕上“取字造词”,所有新造的词,系统都会自动给出正确的输入外码合并入原词库统一使用。
五笔字型最直观,依照笔顺把码编;键名汉字打四下,基本字根请照搬;
一二三末取四杩,顺序拆分大优先;不足四码请注意,交叉识别补后边。
键名输入
各个键上的第一个码元,即“助记词”中打头的那个码元,我们称之为“键名”。这个作为“键名”的汉字,其输入方法是:把所在的键连打四下(不再打空格键),例:
王:王王王王 11 11 11 11 (G G G G)
又:又又又又 54 54 54 54 (C C C C)
如此,把每一个键都连打4下,即可输入25个作为键名的汉字。
成字码元输入
1成字码元:码元总表之中,键名以外自身也是汉字的码元谓之“成字码元”,简称“成码元”。除键名外,成码元一共有97个(其中包括相当于汉字的“氵、亻、勹、刂”等)。
2成码元的输入法:先打一下它所在的键(称之为“报户口”)再根据“码元拆成单笔画”的原则,打它的第一个单笔画、第二个单笔画以及其最后一个单笔画,不足4键时,加打一次空格键。现举例如下表:
成码元 报户口 第一单笔 第二单笔 最末单笔 所击键位
文 文(Y) 、(Y) 一(G) 、(Y) 41 41 11 41 YYGY
用 用(E) 丿(T) 乙(N) │(H) 33 31 51 21 ETNH
亻 亻(W) 丿(T) 丨(H) 34 31 21 WTH空格
厂 厂(D) 一(G) 丿(T) 13 11 31 DGT空格
车 车(L) 一(G) 乙(N) 丨(H) 24 11 51 21 LGNH
3单笔画输入:许多人不太注意,其实5种单笔“一、丨、丿、丶、乙”,在国家标准中都是作为汉字来对待的。在“五笔字型”中,照理说它们应当按照“成码元” 的方法输入,除“一”之外,其它几个都很不常用,按“成码元”的打法,它们的编码只有2码,这么简短的“码”用于如此不常用的“字”,真是太可惜了!于是,我们将其简短的编码让位给更常用的字,却人为地在其正常码的后边,加两个“L”作为5个单笔画的编码
例:一:GGLL 丨:HHLL
丿:TTLL 丶:YYLL
乙:NNLL
应当说明,“一”是一个极为常用的字,每次都打4下岂不慢事?别担心,后边会讲到,“一”还有一个“高频字”码,即打一个“G”再打一个空格便可输入。
“键外字”输入法
凡是“码元总表”上没有的汉字,即“键外字”,都可以认为是由表内的码元拼合而成的,故称之为“合体字”──相当于“分子”。按照前述汉字分解的总原则──“汉字拆成码元”。我们首先应毫不客气、毫无例外地将一切“合体字”拆成若干个码元
合体字的拆分原则
l 书写顺序:拆分“合体字”时,一定要按照正确的书写顺序进行。例:“新”只能拆成“立、木、斤”,不能拆成“立、斤、木” “中”只能拆成“口、丨”,不能拆成“丨、口”;“夷”只能拆成“一、弓、人”,不能拆成“大、弓”。
l 取大优先:“取大优先”,也叫做“优先取大”。按书写顺序拆分汉字时,应以“再添一个笔画便不能成其为码元”为限,每次都拆取一个“尽可能大”的,即尽可能笔画多的码元。例1:世:第一种拆法:一、凵、乙(误)第二种拆法:廿、乙(正)显然,前者是错误的,因为其第二个码元“凵”,完全可以向前“凑”到“一”上,形成一个“更大”的已知码元“廿”。例2:制:第一种拆法: 、一、冂、丨、刂(误)第二种拆法: 、冂、丨、刂(正)同样,第一种拆法是错误的。因为第二码的“一”,作为“ ”后一个笔画,全可以向前“凑”,与第一个码元“ ”凑成“更大”一点的码元“ ”。总之,“取大优先”,俗称“尽量往前凑”,是一个在汉字拆分中最常用到的基本原则。至于什么才算“大”,“大”到什么程度才到“边”,这要等熟悉了码元总表,便不会出错误了。
l 兼顾直观:在拆分汉字时,为了照顾汉字码元的完整性,有时不得不暂且牺牲一下“书写顺序”和“取大优先”的原则,形成个别例外的情况。例1:国:按“书写顺序”应拆成:“冂、王、丶、一”,但这样便破坏了汉字构造的直观性,故只好违背“书写顺序”,拆作“囗、王、丶”了。例2:自:按“取大优先”应拆成:“亻、乙、三”,但这样拆,不仅不直观,而且也有悖于“自”字的字源(这个字的字源是“一个手指指着鼻子”)故只能拆作“丿、目”,这叫做“兼顾直观”。
l 能连不交:请看以下拆分实例:于:一十(二者是相连的)、二丨(二者是相交的)丑:乙土(二者是相连的)、刀二(二者是相交的)。当一个字既可拆成相连的几个部分,也可拆成相交的几个部分时,我们认为“相连”的拆法是正确的。因为一般来说,“连”比“交”更为“直观”。
l 能散不连:
. 笔画和码元之间,码元与码元之间的关系,可以分为“散”、“连”和“交”的三种关系。如:倡:三个码元之间是“散”的关系;自:首笔“丿”与“目”之间是“连”的关系;夷:“一”、“弓”与“人”是“交”的关系。
. 码元之间的关系,决定了汉字的字型(上下、左右、杂合)。
(a)几个码元都“交”“连”在一起的,如“夷”、“丙”等,便肯定是“杂合型”,属于“3”型字,不会有争议。而散根结构必定是“1”型或“2”型字。
(b)值得注意的是,有时候一个汉字被拆成的几个部分都是复笔码元(不是单笔画),它们之间的关系,在“散”和“连”之间模棱两可。如:占:卜口两者按“连”处理,便是杂合型(3型)。两者按“散”处理,便是上下型(2型正确)。严:一厂后两者按“连”处理,便是杂合型(3型)后两者按“散”处理,便是上下型(2型正确)。当遇到这种既能“散”,又能“连”的情况时.我们规定:只要不是单笔画,一律按“能散不连”判别之。因此,以上两例中的“占”和“严”,都被认为是“上下型”字(2型)。
(c)作为以上这些规定,是为了保证编码体系的严整性。实际上,用得上后三条规定的字只是极少数。
“多根字”的取码规则
所谓“多根字”,是指按照规定拆分之后,总数多于4个码元的字。这种字,不管拆出了几个码元,我们只按顺序取其第一、二、三及最末一个码元,俗称“一二三末”,共取四个码。如:戆:立早夂心42、22、31、51(UJTN)
“四根字”的取码规则
“四根字”是指刚好由四个码元构成的字,其取码方法是依照书写顺序把四个码元取完。如:照:日刀口灬22、53、23、44(JVKO);低:亻 七丶 34 35 15 41(WQAY)
不足四根字的取码规则
当一个字拆不够4个码元时,它的输入编码是:先打完码元码,再追加一个“末笔字型识别码”,简称“识别码”。
1、“识别码”的组成:它是由“末笔”代号加“字型”代号而构成的一个附加码。由于教不得法,以前许多人对“识别码”望而生畏。其实,按如下做法,你只要5分钟定能学会:
l “1”型(左右型)字:码元打完之后,补打1个末笔画即等同于加了“识别码”。例:
沐:氵木丶(“丶”为末笔,补1个“丶”)汀:氵丁丨(“丨”为末笔,补1个“丨”)洒:氵西一(“一”为末笔,补1个“一”)
l “2”型(上下型)字:码元打完之后,补打由2个末笔画复合构成的“码元”即等同于加了“识别码”。例:华:亻匕十(末笔为“丨”,2型,补打“刂”作为“识别码”)字:宀子二(末笔为“一”,2型,补打“二”作为“识别码”)参:厶大彡(末笔为“丿”,2型,补打“ ”作为“识别码”)
l “3”型(杂合型)字:码元打完之后,补打由3个末笔画复合而成的“码元”即等同于加了“识别码”。例:同:冂一口三(末笔为“一”,3型,补打“三”作为“识别码”)串:口口丨(末笔为“丨”,3型,补打“川”作为“识别码”)国:囗王丶氵(末笔为“丶”,3型,补打“氵”作为“识别码”)至于为什么这些“笔画”可以起到“识别码”的作用,你只要仔细研究一下区位号的设计与“识别码”的定义便会恍然大悟。
2、关于“末笔”的几项说明:
l 关于“力、刀、九、匕”。鉴于这些码元的笔顺常常因人而异,“五笔字型”中特别规定,当它们参加“识别”时,一律以其“伸”得最长的“折”笔作为末笔。如:男:田力(末笔为“乙”,2型)花:艹亻匕(末笔为“乙”,2型)
l 带“框框”的“国、团”与带走之的“进、远、延”等,因为是一个部分被另一个部分包围,我们规定:视被包围部分的“末笔”为“末笔”。如:进:二刂辶(末笔“丨”3型,加“川”作为“识别码”)远:二儿辶巛(末笔“乙”3型,加“巛”作为“识别码”)团:囗十丿彡(末笔“丿”3型,加“彡”作为“识别码”)哉:十戈口三(末笔“一”3型,加“三”作为“识别码”)
l “我”“戋”“成”等字的“末笔”,由于因人而异,故遵从“从上到下”的原则,一律规定撇“丿”为其末笔。如:我:丿扌乙丿(TRNT,取一二三末,只取4码)戋:戋一一丿(GGGT,成码元,先“报户口”再取1、2、末笔)成:厂乙乙丿(DNNT,取一二三末,只取4码)
l 单独点:对于“义、太、勺”等字中的“单独点”,离码元的距离很难确定,可远可近,我们干脆认为这种“单独点”与其附近的码元是“相连”的。既然“连”在一起,便属于杂合型(3型)。其中“义”的笔顺,还需按上述“从上到下”的原则,认为是“先点后撇”。如:义:丶 氵(末笔为“丶”3型,“氵”即为识别码)太:大丶氵(末笔为“丶”3型,“氵”即为识别码)勺:勹丶氵(末笔为“丶”3型,“氵”即为识别码)
词语的编码规则
1982年底,“五笔字型”首创了汉字的词语,依形编码、字码词码体例一致、不须换档的实用化词语输入法。不管多长的词语,一律取四码。而且单字和词语可以混合输入,不用换挡或其它附加操作,谓之“字词兼容”。其取码方法为:
l 两字词:每字取其全码的前两码组成,共四码。如:
经济:纟又 氵 文(55 54 43 41 XCIY)
操作:扌口 亻 (32 23 34 31 RKWT)
l 三字词:前两字各取一码,最后一字取两码,共四码。如:
计算机:讠竹木几(41 31 14 25 YT***)
操作员:扌亻口贝(32 34 23 25 RWKM)
l 四字词:每字各取全码的第一码。如:
科学技术:禾 扌木(31 43 32 14 TIRS)
汉字编码:氵宀 纟石(43 45 55 13 I***D)
王码电脑:王石曰月(11 13 22 33 GDJE)
l 多字词:取第一、二、三及末一个汉字的第一码,共四码。如:
电子计算机:曰子讠木(22 52 41 14 JBYS)
中华人民共和国:口亻人囗(23 34 34 24 KWWL)
美利坚合众国: 禾 囗(42 31 22 24 UTJL)
五笔字型计算机汉字输入技术:五竹 木(11 31 11 14 GTGS)
注意:在WINDOWS版王码汉字操作系统中,系统为用户提供了15000条常用词组,此外,用户还可以使用系统提供的造词软件另造新词,或直接在编辑文本的过程中从屏幕上“取字造词”,所有新造的词,系统都会自动给出正确的输入外码合并入原词库统一使用。
张洪波- 帖子数 : 13
注册日期 : 11-06-08
您在这个论坛的权限:
您不能在这个论坛回复主题