备案序号:陕ICP备05011274号 您是第 位访问者,请用右边三种统计分析: 统计分析 阿江统计
|
|
张码30使用说明 我在编研“无字库汉字演示和设计软件”时,感到它还可用来研制输入法。三个月以前,我已公布“张碼1.0”和“张碼1.2”。那是用52个部首和五种笔画做输入代码,而且笔画要两两组合成25种字母代码来使用的,实在不适于想打。当时班门斧要我搞出一种更好的纯笔画码来。如果笔画只分5种,不两两组合,26个键位不能充分利用,码长必然太长。如果分为25种,因为它们出现频率相差太大,不能直接使用,我曾让横竖撇捺点5种笔画用其后的笔画来分化,也是不能想打。最后还是采用字根码,即将组字用的928个字根,按它们的首二笔(5*5种)来分类,归为25个字母。25类中,竖折、横竖、撇折类太高,而以捺竖开头的字根竟没有。经过试验调配,一个月前形成“张码2.0”。我试着用它来打了“张码20使用补充说明”。对于拼音不准又难以撑握別的输入法的人,确实易学易用。这个输入法,码长短,最长是3码,加上选字,一个字最多击4键。同码的词汇总排在单字后面,不影响单字的查找,输入单字后,有联想功能。它的学习是很容易的,也不要多少记忆。首二笔横竖撇捺(点)折的两两组合码在键盘上的排列,与张码1.0是一样的,可以算得出来,不用死记(见文末的键盘表)。 难的是要熟识这个系统用了那些字根。考虑一个汉字最少应由那几个字根组成。没有相应字根时,有必要直接使用笔画,相继的笔画串当作一个字根,也取首二笔为代码(只有一笔时,重复该笔)。整个汉字只用第一、第二和最后的字根入码,不足三码时,重复最后的字根。一般字根的代码是什么字母,可由首二笔在键盘上排算出来。但张码20有10个代码(bcdijmoruy),包含由別处(aghpw)转来的字根,它们的首二笔原不属于这个字母,是要硬记的。另外,一级简码的高频字,二级简码的常用字(国标字),只取开头的一个或二个码,只能在一码或二码中找。如果提示栏没有出现该字,也没有出现词(两个字以上),都必须先翻页看看,只当一码的提示中找不到(不是高频字),才打第二码,只当二码的提示中找不到(不是常用字),才可打第三码。现在的张码30在这些方面做了以下改进:
㈠
、全部一级简码,毎个字母都只有10汉字,第一屏提示里没有,就不需要翻页,应该直接打第二码。624个二级简码(本有625个,但简码xj没有字),543个只有9个字,19个还少于9个,提示栏中己出现词组,不需翻页查看后面有没有单字。但有62个码有19个字(因为高频字多),第一屏没有词组,如果10个单字中找不到,应该翻页查看第二屏,但不必查第三屏。张码20因为没有这样划一的规定,常要翻页查证。
㈡
、所有编码中的汉字,都严格按出现频率排序,高频在前。张码20没有做到这点。不过我手中只有“汉字频度统计”(贝贵琴等编)中近六千汉字的确切频数,另外凴我个人的印象,给四千可能用到的字、繁体字赋与更低的两个等级。这一万个汉字以外的字,很少用到,必排在最后。词组改用海峰提供的,词数由3万多增至6.5万,也按词频排序,高频在前。
㈢
、所有字根按首二笔给一个字母代码,因为25种笔画组合在键盘上的排列是很规律的,本不费脑子记忆。但由于字根分布不匀,作了一些硬性调配,较难记住。张码30作了一些调整,只要注意以下三条,就只有最后一条的三点难掌握一些:
⑴
:繁体部首改用相应的简体部首。如“言”不属h而用m(讠),同样,“車”属t,“馬”属n,“貝”属p(貝原本就属p,但按下面的第三条,是要转到u的)。这后三个是30版新加的,调入调出虽有增加(有调出的8个字母,有调入的12个字母),反而容易记住。
⑵
、部首要转到别处的有六,因为单纯,也不难记:“艹、禾”转入j(除去20版的“攵”),“钅、釒、金”都转入y,“氵”转入b,“林14、木、林”转入c(除去20版的“本”),“日、田”转入i。
⑶
、最后因为字根数量多而难掌握的三条是: 1、以“撇折”为首,本属g,但当第二笔“折”是“折弯钩”时(如“勹”),转入d。 2、以“横竖”为首,本属w,但当横竖笔不相交时,转入r。 3、以“竖折”为首,本属p,但字形中有闭合的方口的(如“中同里”等,但除去“口囗日田貝”5个),转入u。 后面列出张码30的“字根码代码表”。表中的第二列,说明什么字根要转移,转到那儿。被转入的字根,在字根列表栏中是用红色的黑体字表示的(字库里没有的字根,用含该字根的汉字后加两个数字——起笔和笔数——来表示,如木字旁用“林14”表示)。为了便于理解和记忆,字根是按相似性分成了几类列出的。(与原先的张码20的“字根码代码表”比较,可以发现一些差别)。初次使用时最好把这张字根码代码表打印出来,放在一旁查对。 张码30字根的(首二笔)代码表
张码30的21210个汉字中,有18244个不须翻页就可选取,占86.0%。其中25个一级码,
250个汉字都不须翻页,占1.2%;254个二级码,6175个汉字中有5555个不须翻页,占26.2%;6343个三级码,16007个汉字中有13626个不须翻页,占58.6%。二级码有620个汉字要翻页,只翻一次;三级码有2381个汉字要翻页,最多翻5次(仅5个字)。因为提示汉字是按固定不变的字频排列的,熟记后也能盲打。 这个编码系统码源文件,是由“无字库汉字演示和设计软件”产生出来的。因为字根是按组字的需要选用的,本身还没有优化,对输入法更不完全合适,首先928个字根不一定都是必须的。例如“枝”和“翅”中的“支”在这里是两个不同的字根,“走、毛、也、见”等,以及“黄”和“黃”、“贝”和“貝”、“足”和“⻊”等等也都是成双的。而“元”字没有取作字根,因为它组成的字不多,且都结构简单,很易由“一兀”组成。另外,我在组字时,还存在一些错误没有改正,已发现“让”字错为“圵”,编码my错为wy,“足”字是字根,却仍用“口”和“疋24”组合,编码uu也错为iy,这些现已改正。但一定还有没有改正的,尤其是笔顺上的错误更多,如“画”字写了“一”后应写“田”,编码应为qo,但是组字时先写“凵”,编码也成为qc。这些没有一一改正。如果某字打不出来,可试试另一种组字方式。 有时也可能是把字形记错了:如简体字“来”的码是r,繁体“來”的码是www,平常写字时,中间的竖写成竖钩,字库里是没有的,故在g、gg、ggg中都找不着。简体字“竖”的码是ubh,
繁体“豎”的码rbr,如果把繁体“豎”中的“臣”写成两竖,字库里也是没有的。字库里没有的字,当然打不出来。 二万多字,大部分认不得,更读不出来,用音码输不进去,用张码30都没有问题。如果同时装了全拼输入法,再把张码30的“编码查询”指向全拼(鼠标右键击张码30输入法图标的左侧,在弹出框中击“设置…”,第一个选择框就是“编码查询”),以后输入任何汉字,在输入码处都会用绿色字母显示该字的全拼,教会你认读。 最后说一下输入法的安装。运行下载的zm30.exe,解压到任一子目录里,再运行该目录下的输入法生成器软件imegen.exe,出现第一个对话框,输入码表源文件zm30.txt,结果如下:
在“创建输入法”选项卡中,点击“浏览”,正确选定码表源文件zm30.txt后,就如上图所示。接下来点“转换”,即开始转换码表,同时有信息诓显示转换了多少词条:
待8万多词条转换完成后,再点“创建”,出现下一个对话框:
填入版本号和机构名称,点“确定”。接下来的两个对话框,都可选择默认的,最后出现:
这时一定要选“是”,输入法就安装好了,可以像“全拼”等一样使用,也可以在控制面板的输入法选项中删除或添加。 以上操作会在imegen.exe所在子目录和windows的system目录生成相同的mz30.mb和mz30.ime文件,请把解压出来的mz.ime,覆盖system目录下的.ime文件(文件名必须用mz30.ime),这样才能借用“俄文字母”的软键盘,来指示字根在键盘上的的安排。方法是用鼠标右键点击图标右边的软键盘,再点“俄文键盘”即可显示如下的软键盘:
对照下面的张码30键盘表,软键盘只是没有表示可推出的首二笔的按排,而代表字根的按排是一样的。在下面的键盘表中,红色字形表示由别处转来。软键盘中不能用颜色表示,特地选用偏旁字根,字库里没有“口、日、月、木、马、车”
等偏旁字根,则选用重叠的“吅、昍、朋、林、騳、轟”表示。qwpafghl等8个键处,本应写第二个字根的地方,却是字母,表示有一部分字根转到这些字母键上。W、P两键处都有3部分,分别转到C、R、T和U
、I、 O键上,但在软键盘上都只能写两个字母cr和uo。 张码30键盘 Q
W E
R T
Y U I
O P
天— 土— 而— 来— 至— 上| 业| 少| 光| 山| n
—
crt |
大/
覀\
轟┐
钅—
⻊|
吅/
昍\ uio ┐
A S
D F G
H
J
K L
我/
的/ 后/ 人/
各/
主 \ 艹\ 为
\ 家 \
jy—
向|
朋/ y \ d
┐
m —
秝|
火/
b \
Z X
C V B
N
M
民
┐
也 ┐
女┐
又
┐
了 ┐
心 \
比— 林|
小/
氵
\ 騳 ┐ 訁 ┐ |