1. 简单百科
  2. 五笔字型输入法

五笔字型输入法

五笔字型汉字输入法是一种录入简单、规则容易理解、重码率低、有利于盲打的形码输入方法。使用五笔输入法输入汉字,从根本上说就是按照输入的规则输入汉字字根并通过对不同字根进行编码而构成不同汉字字符编码方式。

1983 年,王永民在王码五笔字型方面的研究取得了根本性突破,从而解决了用汉字输入计算机的“速度与效率”的问题,完成了第一次汉字输入技术革命。

王永民还在2000年申请了专利五项,并创造出了一种简单、易学的输入法——只需要6个或9个数字键,就能完成用汉字输入计算机的“数字王码”输入法,它既解决了汉字检索输入难的问题,又解决了拼音输入造成的不用写字和不会写字的问题,学术界称之为“第二次汉字输入技术革命”。

发展历程

开发人

王永民教授是导师,同时也是王码五笔字型的发明人,他还担任中国发明协会副会长一职。王永民教授,出生于1967年,是中国科学技术大学无线电电子学系的毕业生,他的家乡在南召县。一位具备教授级别资质的高级工程师,被国家认可为具有杰出贡献的专家,因此获得了国务院的津贴,并且荣获全国五一劳动奖章,同时还被评为全国劳动模范,堪称当代的毕升

在1978年至1983年期间,他发表了《形码设计三原理》这一论文,率先提出了在标准键盘上设计形码的数学模型和字词兼容理论。经过长时间的努力,成功发明了“五笔字型”汉字输入计算机技术,并获得了美国英国和中国的专利。这项技术从根本上解决了汉字输入计算机的速度和效率问题,并努力推广了20多年,成为中国领先的汉字输入技术。

此后,王永民教授发明了“数字王码”,解决了如何利用键盘便利高效地输入汉字的难题,打破了我国输入法进口垄断,使汉字输入技术迎来“二次革命”。

王码是我国独立研发的重要高科技成就,其技术被授予了“国家技术发明奖”。20多家国际科技公司购买输入技术的专利使用权,王永民教授曾受邀到联合国讲学,因为他开发的软件在联合国和东南亚各国得到了广泛的应用,给国家带来了荣誉。

发展历史

五笔的传说是一部关于创新和发明的史诗,它记录了人类智慧和创造力的历程。大约在1980年左右,计算机开始在全球范围内广泛应用,并逐渐渗透到中国的各个领域。

五笔输入法最早出现在上世纪70年代初,在1970年至1980年期间,人们采用一字一键的全字键盘,以提高键盘输入的效率;在1981年,日本进行了一项研究并成功发明了一种主辅整字的键盘,由一块主键盘和一块辅键盘构成,辅键盘负责定分区,主键盘按对应的按键就能输入分区中特定的汉字,该键盘减小了设备体积,可以双手打字,加快打字速度,缺点是打字员需要记住每个汉字处在哪个分区,排序在哪个位置。

1982年,在北京大学完成了汉字拼形组字中键盘的开发与生产,最后推出了一个二百五十六键、包括一千多个部件的产品。只需要按照汉字结构,组合不同的按键就可以拼出想要的汉字,中键盘第一次用到了拆字的方法,也就是汉字编码类型中的形码。

1983年,王永民发明了一种名为“末笔字型识别法”的方法,该方法能够显著减少重复码数量。仅需使用英文键盘上的26个字母键,即可准确输入汉字。同年8月28日,河南省科委对26键五笔字型进行了鉴定,认定结果在郑州通过。王永民发明的五笔输入法正式问世。当时的五笔输入法是基于汉字的笔画顺序进行编码,使用不同按键来输入不同的笔画组合,以输入相应的汉字。

在2000年,王永民成功申请了五项专利,创造了一种简单易学的输入法,只需6个或9个数字键,即可实现汉字输入计算机的“数字王码”输入法,这一技术被学术界誉为“汉字输入的第二次革命”。“数字王码”是以汉字“字形”为基础,采用数字按键的一种汉字输入方式。数字王码分为两大类:一类是“王码6键”输入法,6个码元,10分钟即可学会;另一类是“王码9键”输入法,比王码6键多用了3个数字键,20多个码元,重码少,单手打字,但比6键快得多,1小时可以学会。

在1983年到2008年的25年时间里,王永民在86版的五笔输入法基础上进行了两次重大的改进,申请了1998和新世纪两代新版本的专利,经过不断改进,王永民先后推出了三个版本的五笔输入法:86版、98版和新世纪版,加入了新的编码规则,使得输入速度更快、更准确。为了方便用户选择使用这三个版本,王永民又研究发布了大一统五笔字型软件。随着计算机技术的发展,五笔输入法逐渐成为主流输入法之一。这个阶段的五笔输入法进一步优化了编码规则,减少了重码率,并且增加了一些特殊字符和词组的输入方式,提高了输入效率。

到了21世纪,随着计算机和互联网的普及,五笔输入法得到了广泛应用。这个阶段的五笔输入法更加注重用户体验,许多五笔输入法提供了更多的个性化设置和功能,如智能联想、词库管理等,使得输入更加方便和高效。近些年,五笔输入法仍在不断发展和完善。随着人工智能和自然语言处理技术的进步,五笔输入法的智能化程度越来越高,可以根据用户的输入习惯和上下文进行智能预测和纠错,提供更加个性化和智能化的输入体验。同时,五笔输入法也逐渐与其他输入法相结合,形成了多种输入方式的综合输入工具。

五笔输入法基础知识

笔画知识

笔画、字根 (也叫部件、码元)和整字是汉字结构的三个层次。字根是构成汉字最重要的单位,笔画是构成汉字的最小结构单位,所谓笔画,是指用笔写字时,用笔在纸上画出的线条。每次写笔画时,无论笔头在纸上所沿的线条是水平的还是垂直的,是长是短,是直的还是弯的,都统称为一笔。

注意:竖右钩属于折类,而竖左钩属于竖类。

为了方便记忆和规范,国家标准规定分别用 1、2、3、4、5 作为 5 种笔画的代号:

字型知识

传统上,我们把构成汉字的基本笔画结构称为字根或部件,当字根或部件用于编码时,它们也可以称为“码元”,即编码的元素。

由此可以得出,汉字图形中的位置关系是重要的特征信息。在对汉字进行编码时,将这些字符的特点用数字来表达,对重复代码进行识别是很有帮助的。

在五笔输入法的概念中,汉字分为三种结构,即上下型、左右型和杂合型。其中杂合型结构包括半包围结构、全包围结构、独体字等,是指除左右、上下结构汉字外的所有结构汉字。

关于字型有如下约定:

根据各种字型的特征,将字型命以数字代号如下表所示:

86版五笔字型

86版本五笔字型

五笔字型选出的130种基本字根,按照其起笔笔画代号,并考虑键位设计的需要,共分为5个区,每个区又分为5个位,命名为区号位号,这样共得到:11-15,21-25,31-35,41-45,51-55共25个键位,其中一区有27个基本字根,二区有23个,三区29个,四区23个,五区28个。每个键位上一般安排2至11种字根,字体较大的字根是主要字根。每个键位对应一个英文字母,11-55这样的数字称为键位代码,再从具体同一键位代码的一级字根中选出一个有代表性的字根作为键名(每个键位方框左上角的字根就是键名,称为键名字),由此形成了一张五笔字型键盘字根总图。

86版本五笔字型字根键位图

86版本五笔字型字根口诀

98版五笔字型

98版本五笔字型与86版本五笔字型的区别

其主要区别如下:

1) 对构成汉字的基本单元的称谓不同

在86版五笔字型编码方案中,把构成汉字的基本单元叫做字根,而在98版五笔字型编码方案中则称为码元。

2) 选取的基本单元数量不同

在86版五笔字型编码方案中,一共选取了130个字根作为构成汉字的基本单元,而在98版中则选取了245个字根。

3) 处理汉字的数量不同

86版五笔字型只能处理国标简体字的6763个字,而98版五笔字型不仅可以处理国标简体字中的6763个字,而且还可以处理BIG5码的13053个繁体字以及中、日、韩3国大字符集中的21003个汉字。

4) 字根选取更规范

86版五笔字型无法对某些规范字根做到取码,而98版五笔字型的字根和笔划顺序完全符合规范。如86版五笔字型编码方案中需要拆分的“末”、“甘”、“气”、“毛”、“丘”、“夫”、“羊”、“母”等字根,在98版五笔字型编码方案中都作为一个字根,可整字取码。

5) 编码规则简单明了

86版五笔字型在编码时要先拆分字根,在拆分时常与语言文字规范产生矛盾。而98版五笔字型编码方案中的“无拆分编码法”将总体形似的笔划结构归为同一字根,一律用字根来描述汉字笔划结构的特征,使编码规则更加简单明了,从而解决了86版五笔字型在编码时与语言文字规范产生的矛盾,使五笔字型输入法更趋合理易学。

98版本五笔字型字根键位图

98版本五笔字型字根口诀

第三代五笔字型(新世纪版)

第三代五笔字型(新世纪版)

为保持技术的连续性,第三代五笔字型(新世纪版)的25个“键名”没有变动。新设计的字根体系更加符合分区划位规律,更加科学易记而实用,按规范笔顺写汉字的人,取码输入更便捷。

第三代五笔字型(新世纪版)简体、繁体字根键位图

2018版本五笔字型大一统

2018版五笔字型大一统创新内容

1.简繁同台

在字母键“五笔”输入状态下,同一编码,用大写字母输入,显示繁体字(以及没有简体的字);用小写字母输入,显示简体字(以及字符集内的字):如:XAG~ 紅,   YGKG~語,    xag~红;   ygkg~语。

2.插打拼音

在五笔字型输入过程中,可以直接用“ ` ”(在键盘上排数字键1 的左边那个键上)引导,用全拼输入汉字,同时,显示出五笔字型编码,帮助学习五笔。插打之后,自动返回五笔输入状态。

3.三代同堂

2018版软件包含五笔字型第一代、第二代、第三代(86 、98 、新世纪版)共“三代版本”;在同一台电脑上,三个版本随意切换,各个版本功能相同。

4.快捷符号

王码首创58组“王码符号双轨输入法”,可轻松输入900个符号。如按词汇码:输入(王码五星)GDGJ,即可显示“ ★ ☆ ”;输入(王码三角)GDDQ,即可显示“ ▲ △ ”;输入(王码日期)GDJA,即可显示“ 当天日期”。

5.提示编码

可提示五笔编码、字根分解、汉语拼音。

五笔输入法

数字王码

基础介绍

“数字王码”是以汉字“字形”为基础,采用数字按键的一种汉字输入方式。数字王码能在计算机和手机上利用数字按键准确地输入文字,同时,数字王码也克服了记忆大量的字根、查找汉字困难、用笔书写时容易忘记、写字困难等问题。

数字王码,主要有两种输入法,一种是用1到6的数字按键进行汉字输入,一种是用1到9的数字按键进行汉字输入。按照不同的取码方式,将其划分为“前四末一”,“首部-余部”两类,构成了由简易到快捷的四类不同的编码输入法。

数字王码不但能实现单字的输入,而且能实现词汇的快速输入。另外,王码四合一为“纯形码”,其特点是能够按照字形来输入。在实际应用中,避免了提笔忘字的汉字危机,对汉字的继承和发展起到了积极的作用。

数字王码的优缺点

数字王码的优点

首先,“数字王码”是一种通用的输入法,可以通过汉字中的图形,直接“读”出“数字码”,这种输入法适用于多种产品;

其次,它还是一种新词典,将输入代码由小至大进行排列,就能从汉字图形上看出汉字页码的所在位置,这是汉字检索方式的一次变革;

第三,因为输入码与检索码都是以书写次序与规范的笔画为基础,所以,只要有人输入和进行搜索,就等于是每天温习与练习汉字的写法。基本杜绝了不会写的情况,降低了拿笔忘字的几率。

另外,“王码”有上百万的使用人群,王码的基本常识也变成了大众常识。“数字王码”正是以此为基础,初等教育阶段的学生都可以在不需要教师指导的情况下进行学习,因此,它的用户群非常庞大,容易普及。

数字王码的缺点

五笔是形码,需要学习它们的输入规则,导致数字王码学习曲线陡峭,入门阶段较难,需要二次学习,学习门槛会降低用户普及,使得数字王码鲜为人知。

“数字王码四合一”的四种取码输入法

王码6键(前四末一取码法)

王码 6 键(前四末一)是一种以输入数字为主的输入法,这种输入法是使用“1-横,2-竖,3-撇,4-捺,5-折,6-口”取汉字前四码和最后一码打字。

“王码 6 键前四末一”输入法,是最简单的一种打字方式。只需将汉字中的每一笔或每一部分(也就是六个基础符号),用对应的数字来表示,即可像写字那样,将汉字中的每一个单词、每一个单词,都按下数字按键即可完成。

6个基本码元,包括汉字的5种基本笔画和部件“口”。分别用 1、2、3、4、5、6 作为代码。如下表所示:

王码6键(首部余部取码法)

“首部——余部”输入法,采用第一节“前四末一”输入法一模一样完全相同的码元和数字键盘。

关于“键元”的说明:键元的选用和设计,是根据编码设计的需要而确定的。“编码”的需要是指编码空间分布、键位负荷等理论指标。分配在数字键上的笔画或笔画结构,才称为键元,也叫码元。码元是被优选参加编码的字根,字根不一定是码元。

合体字的取码法

即:编码=首部编码(1~2个码)+余部编码(1~4个码)

取码示例——:

首部为“鼻”,取头尾两个笔画:丿丨,数字代码为“32” 余部为“查”,取前三末一:一丨丿一,数字代码“1231”

整体字的取码法

对于整字,最多取5个码,取前4和最末1个笔画。(键元)

取码示例——我:

取前4画“丿一亅一”和最后1画“丶”,对应的数字代码为“3121 4”。(注:对于“我”字,其王码6键、王码9键的编码正好相同)

词汇的取码法

词汇码长都是6。词汇不超过64个字,不管词汇的长度,都输入6个码。

王码9键(前四末一取码法)

王码9键,用1 ~ 9共9个数字键(包含0键),采用9个数字键作为编码的码元,即笔画和组合笔画,共有20种,如以下数字键盘所示:

取码法要点
王码9键(首部余部取码法)

“王码9键首部——余部”与“王码9键前四末一”输入法的码元即键位设计“完全相同,由于采用了“首部——余部”取码法,最大码长由5变为6,重码更少,因此效率更高。

合体字的取码法

即: 编码=首部编码(1~2个码)+余部编码(1~4个码)

取码示例——齄:

首部为“鼻”,取头尾两个笔画:丿丨,数字代码为“32”。余部为“查”,取前三末一:十八日一,数字代码“7891”。

说明:

9键与6键相比,多了7、8、9三个键,码元较多,取码时应优先选取码元,不能将码元分割成单个笔画。

整体字的取码法

对于整字,取前4个和最末1个笔画(键元)

取码示例——成:

取前4画“一丿乙乙”和最后一画“丶”,对应的数字代码为“1355 4”。(注:“成”字王码6键、王码9键的编码正好相同)

词汇的取码法

词汇码长都是6。词汇不超过64个字,不管词汇的长度,都输入6个码。

五笔输入法的优劣

五笔输入法的优势

“五笔字型输入法”是一种仅用25个字母按键根据一定的规则将全部汉字分割开来的有效打字方式。然后,将分割出来的有代表性的部分与键盘相对应,并用字根通过拼形组字向计算机输入汉字和词语。这种输入法具有以下优点:

首先,形码输入,重码少,输入准确。不需要考虑发音,只需要根据字形进行编码就可以了,具有很强的唯一性。汉语方言多种多样,不同的地区口音和语言习惯都不相同,加上有些汉字具有多个读音,使得输入拼音变得困难。五笔字型不受语音和方言的限制,从结构的角度决定了汉字的独特性和唯一性,达到了速度快和输入准确性的目的。平均每输入 10000 个汉字,才有1~2个字需要人工挑选。因此,是目前效率最高的汉字键盘输入法。

其次,指法标准和输入法标准化。“五笔字型”用两只手的10个手指来输入按键。键盘上手指的划分、击键的速度、键序的连贯都有完整的标准,打字时按照标准指法进行输入,并且经过大量训练后,一般每分钟可以输入一百个单词,每个单词的码长通常在2-3个左右。平均代码长度更短,击键次数更少,减少了手指疲劳。

第三,同时包含汉字和词语。采用“五笔字型”可以输入单个汉字和单词,不论汉字多么复杂都只需要4次按键就能够成功输入。在切换汉字和词语的同时不需要添加其他操作和运算,既符合汉语构词灵活特点,也极大地加快了词汇的输入速度。

第四,多目标统一。根据“形码设计三原理”,对“五笔字型”的字根进行研究,以确保其在使用中能够与其他字根具有良好的相容性,从而减少重码现象;键位的排列符合一定的规律,使字根易于记忆和学习,同时也能够降低使用者的学习成本;指法设计符合一定的协调性,使每根手指的击键负担平衡合理,使用者能够更容易地掌握输入技巧。

五笔输入法的劣势

1.学习曲线陡峭:学会并熟记字根是使用五笔输入方法输入汉字的前提条件,而想要熟练地进行五笔输入法拼写需要经过大量的拆字练习才能掌握要领。相比拼音输入法,五笔输入法的学习成本、时间成本和门槛更高。

2.高度依赖码表与词库:所有输入法,都是基于码表的输入方案。而形码这种基于汉字的方案即使支持了词语的输入,也只是作为单字输入的一种辅助。能输入的词取决于码表,而大部分的五笔输入法并没有自定义词的功能,只遵从固定的码表,或是直接导入写好的外部码表。

计算机汉字键盘设计“三原理”

在王永民发明五笔字型的过程中,他提出的汉字键盘设计“三原理”及其数学模型尤为重要:

一是相容性原理。相容性原理指的是保证编码的唯一性。相容性是指多个编码元素同时存在于相同的关键字时,它们之间的相互关系。在输入时,要尽可能的少输入一些重码。更少的重码字意味着更高的效率。将125个词根分成25个组合,只使用25个键位。每个组合对应一个键位。分组的难点在于如何将不同的字符根和谐地组合在一起,打字时不互相影响,尽量减少重复字符的数量。要实现这一“相容性原理”,必须要做上百万个字根组合的试验,才能计算出每一个字根的变动对重复代码产生的效果,从而在无穷无尽的组合中找出最好的组合。

二是规律性原理。规律性原理指的是保证编码的易学性。在键位上安排字根后,要根据笔画特点,有规律地划分和标记位置,以利于记忆。规律性是指编码元素在每个键位和整个键盘上排列和分布的规律性。在字根“相容”的条件下,相同的键位上的字符根,不同的键位间的字符根,以及不同的行键上的字符根,以及它们的最优键位的设计,都应遵循某种规则,便于学习和运用。“规律性”是设计者事先提出的一种规定,比如根据经验事先给出一个可以使字根遵从的规律,然后,在许多种字根相容(重码少)的若干种组合中,筛选最具规律性要求的设计。规律性的文字表述是通过设定一个或者多个简单的规则,让学习者迅速地在键盘上找出一个字根处的按键,然后按下相应的键。学习时间愈短,则其规律愈好。

三是协调性原理。协调性原理指的是保证输入按键符合人机工程学原理,以实现高效率。协调性是指每一位键位上出现的编码要素的可能性,它与相应手指的击键能力是否相符,可用键位的可能性和手指的击键能力系数的一致性进行量化。以“相容性”和“规律性”为基本目标,根据协调性计算公式,计算出用编码规则输入大量文字时的不同手指的负荷量。打字的负荷量应该与各个手指的击键频率相适配,也就是比较食指和小指的负担差异,食指承受能力强,小指承受能力弱。因此,在输入键盘的设计中,要考虑手指的协调性。

在汉字键区的设计中,最大的难点就是“三原理”的“三重积分”问题,两者既矛盾又统一,应同时达到最优值。这是一个使用大数据演算来接近目标的实验过程,为了实现相容性,规律性和协调性的统一,王永民在积累大量统计数据的基础上,经过无数次试验,并构建了相应的数学模型,最终完成了汉字键区的优化设计。五笔字型之所以能从成千上万的汉字输入法中脱颖而出,正是因为有科学理论与试验方法作支撑。

数字键汉字编码技术体系结构

下图是以“数字王码”为案例,绘制的有关数字键汉字编码输入技术“递进式”体系框图。

相关事件

1982年,王永民向罗干同志作了半个小时的报告,并作出了军令状,当时王永民得到了一笔10万元的巨款,因而获得了使五笔式发展起来的机会。在过去的20年里,王码向国外进行发展,并占据了国际市场中输入法的份额,“五笔”也因此成为了文字录入的代称。五笔输入法处于一个盗版普遍出现的困境,它也成为盗版行为的主要受害者。尽管王永民是王码输入法的发明者和权利人,但他毫无办法来抵制市场上相关兼容王码的盗版软件发生。另外,随着拼音输入技术的不断改进,拼音输入法正以强劲的发展势头成为输入法市场的竞争主力,使得王码五笔输入法无法立足。

随着用户需求向低端化发展,谷歌搜狗等互联网公司推出了免费的拼音输入法软件,并通过互联网技术对词典进行优化,大幅提高了汉字输入的效率,导致五笔输入法走向衰弱,与此同时,与拼音输入法的简单易学对比,五笔输入法学习困难,导致五笔输入法的市场份额逐渐减少。

面对盗版行为的蔓延和拼音输入法的挑战,在2007年5月21日,王码输入法软件与数字星空合作,共同推动五笔输入法的发展。 数字星空是一家软件发行服务商和在线软件运营商,通过与王码的合作,数字星空成为了王码在全国独家经销商。数字星空在营销和在线销售方面能够给王码带来更多的机会,这次战略合作对于数字星空和王码来说都是一个双赢的局面。

影响评价

数字星空的CEO刘建华认为,与王码的合作文化意义大于商业意义。“和王码合作有一种社会责任感。互联网是汉字文化的沙漠,拼音让我们慢慢不会写字了,因此我们要尊重汉字、尊重汉字特点和文化价值,所以必须推动五笔字型的普及。”刘建华说。

参考资料

王永民:“五笔字型”发明以后.红色文化网.2023-08-03

王码五笔学习及三种版本的异同 .360文库.2023-08-03

王码春秋.王码.2023-08-03

1983年8月:五笔字型输入法诞生.新浪科技.2023-08-03

26键VS九宫格,中文输入法45年发展史.腾讯网.2023-09-25

1. 王码产品.王码官网.2023-09-25

百度五笔输入法智能化输入由你掌控.新浪科技.2023-08-17

北京王码创新网络技术有限公司董事长王永民——让汉字跨过数字鸿沟(图).中工网.2023-08-03

汉字的基本知识- 王码五笔.豆丁网.2023-08-03

王码大一统五笔教材 .360文库.2023-08-03

首部余部笔画数字编码汉字输入法及其键盘的制作方法.360文库.2023-08-03

五笔字型编码规则.360文库.2023-08-04

86版五笔字型键盘字根总图.360文库.2023-09-25

王码春秋.王码官网 .2023-09-25

王码春秋.王码官网.2023-09-25

98版五笔字型与86版五笔字型的区别.豆丁网.2023-09-25

王码春秋.王码官网 .2023-09-25

王码春秋.王码官网.2023-09-25

第三代五笔字型(新世纪版)简体、繁体字根键位图.豆瓣.2023-08-03

王码春秋.王码官网.2023-09-25

数字王码“四合一”教材.道客巴巴.2023-08-03

数字王码——时代的产物.王码.2023-08-03

五笔输入法是否将淘汰.搜狐网.2023-08-15

王码6键.王码.2023-08-03

王码春秋.王码.2023-08-03

取 码 歌.数字王码.2023-08-03

简介“王码9键”.王码.2023-08-03

取 码 歌.王码.2023-08-03

尝试了 7 种输入法之后,我想和你聊聊在 2022 年用五笔的体验…….网易.2023-09-25

王永民:我的五笔 我的三十年(2).新浪财经.2023-08-06

王永民:一次不服气成就了“五笔之父”.中国新闻网.2023-08-04

王永民:拼音输入法有消灭汉字之嫌.新浪科技.2023-08-03