QQ登录

只需一步,快速开始

开启辅助访问 切换到宽版
搜索

“东里五笔正字版”对五笔98版字根码元的修订说明(未定稿)

[复制链接]
发表于 2015-12-5 17:15:35 |阅读模式

98版五筆在制訂時,就已經考慮到錄入繁體字的問題,因此字根的設計上比86版要合理很多。但是,依舊有一些可以修訂的地方,特别是在錄入古籍過程中,更是有很多困扰。


對于錄入古籍來説,新舊字形的對應是一大問題。比如虚、虛就是新舊字形不同,雖然看起來两个字差别很小,但在五筆編碼上却完全是兩回事,原因就是舊字形的下部没有單獨的編碼。而UNICODE收錄的用虛做偏旁的字則有些混乱,雖然大體上是以新字形的虚爲主,但偶尔也有收舊字形的,還有兩形兼收的,這样的收字,對古籍錄入來説,必定造成一定的困扰。而不同公司出品的字體,所采用的字形標準又不同,甚至古籍中也時常出現同一字,字形略有不同的問題,這些問題,我考慮對五筆98版的字根碼元進行適當的調整,希望能解决一部分(全部解决是不可能的)。


在實際使用過程中,已經有部分字形就將新舊字形編爲同碼了,主要就是“言”字新字形上面作點,舊字形作横,而編碼一律作“Y”。


五筆的字根分布,本就有個别不合理,爲了照頋新舊字形的對照,勢必造成一些新的不合理現象,這也是無可奈何的。


此下的修訂,純屬爲个人需要而作,既無理論支持,也不必管是否與官方版本一致。


本修訂衹使用于“東里五筆正字版”中,“全字版”不使用本修訂。


一、增加字根类


這种字根調整,原則上采取以类相從,便於理解爲準則,盡可能的减少對新字根的記忋。參考的字根如车車(L)、贝貝(M)、门門(U)。


1、“虚”“虛”同編碼。即將虛字舊字形中的下半部分与新字形同編入“O”鍵。同時,删削掉字庫中兩形兼收的新字形字,只保留舊字形字,因UNICODE收錄的大多爲新形字,而只有少數兼收新舊二形,故目前祇删削掉:虚、戯、嘘數字。正字版已將碼表做適當調整,今後使用“東里五筆正字版”錄入,凡遇虛字,不論新舊字形,皆用“HO”做編碼。另,舊字形虛字下部,亦有用在個别字上面做部件的,如:“𪦾”“𬥟”“𬐧”,原來此部件編碼爲“JNHG”,以後一律改爲“O”。


2、“糹”“糸”同編碼。這兩个字形,本就是同一字的不同寫法而已,而糹編爲“X”,糸編爲“XI”,古籍中,這兩种寫法都常見,根本不會被看成兩字,所以直接將這兩个字形都編爲“x”,我認爲很合理。


3、“青”“靑”同編碼。“靑”字原編碼“gmhg”,現改成与“青”相同的“GE”,以“靑”作偏旁的亦重新修訂,如:“淸”之類。(按此條考慮删削掉“青”“清”二字,暫未定,先將此二字放在“靑”“淸”二字之後。)类似的還有“角”字的新舊字形亦同編碼。


4、“幵”“开”編入G鍵中。解決“开”“并”等字的新舊字形問題,同時,“幷”則編碼爲“rgj”。


5、“入”字隨“人”字編入“W”鍵中。可以解决“内”“內”這类新舊字形的問題。


6、新增“亼”“𠓛”“亽”編入W鍵中。這兩个字根是經常出現,拆開之後,并不利用錄入。而且增加這两个編碼之後,可以解决“食”字做偏旁時編爲“WV”的不合理現象(98五筆專設一字根,僅用於食字在左邊做偏旁之用)。还可解決有些字“人”下面或横或點的問題。按此二字根,只有當确定上面是“人”字且不與其他筆畵組成字根,而横或點不與其他筆畵相連、且无法与其他筆畵构成字根時才有效,如“合”“會”“倉”“今”之类方成立,如“奏”“全”“余”“奞”“𣁁”之类則不成立。按““𡶍””字是否拆成“mwa”待考慮。


7、新增“户”“戶”“戸”,編入“N”鍵中。可以解决“户”字的新舊字形問題(所字左邊也是户字。)注意不論新舊字形,在做爲部件時,末筆統一爲横。而“户”做爲單體字時,暫編碼爲“nynt”。


8、“禸”應編入“M”。字部件新舊字形有差别,獨立編碼可解決。設想中。


9、“高”“髙”上部應統一編爲“Y”。設想中。


10、“耒”應編入“D”鍵中。可解決有些每一筆作撇,有些作横的問題(也是新舊字形的問題)。設想中。


11、將“卝”編入“A”鍵中。可以解决寛字的字形問題。而且有部分UNICODE收字,應該是“艹”而字形則爲“卝”,亦可一並解決。設想中。


12、增設“{鬼-厶}”“甶”作爲字根編在“R”鍵中。鬼字。此二字根隨“白”字編在“R”鍵,容易理解。{鬼-厶}是一个常用偏旁,原來拆成“RQC”,現在做爲單獨字根後,可以减少此偏旁的重碼量。而“甶”可与“白”配合,解決“卑”字的新舊字形問題,如遇新字形就拆成“白+丿+十”,如遇舊字形即拆成“甶+丿+十”,編碼相同,容易輸入。按增加“甶”在“R”之後,“鬼”字新舊字形已可解决,然而爲减少“鬼”作偏旁時的重碼,還是應考慮“{鬼-厶}”作字根。


13、“黃”“黄”同編碼。就是在廿字根下面加一横,以解決新舊字形問題。


14、“𫡑”“𠂹”隨“乑”同編入“I”。包括“眾”的下部,本與“乑”、“𫡑”爲同一字,手寫變形而已,且字形近似,故應編入同一碼中。而“𠂹”則以字形近似,容易類推而編入。(按,“永”也可考慮編爲“YI”)


15、“𠁁”應編爲單獨字根。屬難拆字根,應考慮做爲字根存在。設想中。


16、“产”字應做爲字根。可解決“產”、“彦”之類新舊字形問題,而且“产”本身即是“U”鍵一級簡碼(按在正字版中已相應替換爲“產”,然而依舊容易類推),故記憶起來并不麻煩。此字根亦用於“亷”字。原编中,彥爲上下結構,彦爲左上包圍結構;產爲上下結構,産爲左上包圍結構,現統一爲左上包圍結構。


17、“冎”編入“M”鍵中。其實類似的字根已存在此鍵位中,即“骨”字上部,此二部件,字形相似,歸爲一鍵很合理。


18、“牛”字做爲字根。98版中,將在合體字左邊做偏旁的“牛”字編在“C”鍵,而做爲獨體字的“牛”則編碼爲“TGK”,實不合理。牛字在左旁時,僅僅是下横改爲提,字形變化极小,完全可以編爲一碼,考慮至重碼和改編工作量,可考慮編入“C”鍵中。設想中。


19、“來”字應做爲字根。可减少“麥”字作偏旁時之重碼率。設想中。


20、“夊”隨“夂”编入“T”键中。


21、“龴”“卩”應予統一。解決“令”字新舊字形問題。設想中。


22、新增“𨸏”“吕”“呂”,并將“𠂤”字根一同移入“K”鍵中。可解決“吕”“呂”新舊字形問題,同時以類相從,更容易理解。設想中。


23、新增“𫠤”字根。以解決“敖”字新舊字形問題。


24、新增“示”(礻)字根。可解決偏旁在左時的字形問題。


25、“犭”應編在“Q”鍵中。


26、新增“片”字根在“R”键。設想中。


27、新增“𦍌”“差”字除“工”外部件、“飬”上部,做爲字根在“U”鍵。可解決“羌”“差”等字的新舊字形問題。設想中。


28、新增“竹”字根在“T”鍵。其實“T”中已有“𥫗”,本即是“竹”字做部首,而將“竹”字編碼爲“thth”實不合理。設想中。


29、“屮”編入“B”鍵中。包括中竪寫成竪撇。


30、“商”上部類似“六”者歸入“U”鍵中。


31、“艹”不論新舊字形,統一編入“A”鍵。此條亦用於“全字版”中。


二、修改移動字根類。


1、彑与彐同編“V”。可以解决“錄”字新舊字形的問題。設想中。


2、“八”“丷”“儿”應同歸入“R”鍵中。可解決“平”“曾”“空”“兼”之類字的新舊字形問題。設想中。


3、“勹”“几”同編碼。可解决“没”字新舊字形問題。設想中。


4、𠂊”“遙”上部、“爰”上部歸入一鍵。考慮歸入“丿”所在的“T”鍵中。


三、修訂拆字方法類


1、“兼”字的編碼。“兼”字86版拆成“UVOU”,而98版拆成“UVJW”,新世紀版拆成“UVOU”与86版相同。根據“O”鍵上的字根,應該拆成“UVOU”較合理。正字版中,“兼”字一律修改爲“UVOU”。并將上面丷寫成二撇的字形一并歸入。


2、麥字下部的修訂。五筆將最末一碼編入“Q”,認爲与“夕”同,實際是大謬不然的!“夕”字一點不出頭,而“麥”字下部則是“夊”的手寫變形,將撇改爲長點而已,而且這一點是要出頭的,應隨“夊”字編入“T”鍵中。(按“夊”字編爲“QYI”,已歸入“T”鍵中。)


3、“来”字的編碼。“来”字現在一般是作爲“來”的簡化字存在的,但《康熙字典》中收錄有个别帶這个部件的字。這个字形,86版拆爲“GOI”(“I”是識别碼),98版拆爲“GUSI”,新世紀版拆爲“GOI”。拆爲“GOI”較合理,故在正字版中改過來。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即註冊

本版积分规则

QQ|网站地图|小黑屋|Archiver|東里論壇 ( 粤ICP备14015598号 ) 公安备案图标粤公网安备 44512202000019号
GMT+8, 2024-3-29 02:02 , Processed in 0.091728 second(s), 43 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.