欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

“全息字典”:古今汉字任你查

时间:2023-02-17 14:57:54 | 浏览:360

快捷、权威、形象——准确查找一个难检字的相关信息再不用跑遍古籍阅览室,翻便“大部头”,只需轻点鼠标——登录汉字全息资源应用系统,点击现代通用字集,搜索要查找的字,不仅能够显示其现代字形、字音、字义信息,还可以查到该字从甲骨文、金文到篆书、楷

快捷、权威、形象——准确查找一个难检字的相关信息再不用跑遍古籍阅览室,翻便“大部头”,只需轻点鼠标——登录汉字全息资源应用系统,点击现代通用字集,搜索要查找的字,不仅能够显示其现代字形、字音、字义信息,还可以查到该字从甲骨文、金文到篆书、楷书的历史字形演变过程,从《说文》《尔雅》《方言》《释名》一直到《康熙字典》等历代辞书对该字的释义,及其在一些常用古籍文献中被使用的情况。

日前,国家语委重大基础资源建设项目“通用汉字全息数据库建设”的标志性成果“汉字全息资源应用系统”正式启动上线。该项目旨在运用现代中文信息处理技术,构建一个具有多维关联关系、科学系统、高效实用的汉字全息数据库。

“无论是初学汉字的小学生,还是研究汉字的学者,系统都可以提供相应的帮助。”项目主持人、北京师范大学教授王立军介绍,系统采用的多层级字集设计模式,包括常用字集、现代通用字集、古籍印刷通用字集、全字符集等。常用字集可以满足中小学基础教育领域的一般需要;现代通用字集可以满足社会文化领域一般汉字使用者的需要;古籍印刷通用字集面向具备一定古汉语知识、阅读一般古籍文献的用户;全字符集则可以满足汉字研究的专业人士需求,为专业研究提供支撑。

借助资源库,给汉字家族绘家谱

作为一名古文字爱好者和研究者,张华的书桌上摆满了各种字典、工具书——查找一个字在不同时期形、音、义的演变经常要翻阅多部“大部头”才能找到相对准确、权威的答案,而线上的一些汉字数据库很多又存在收录不全、权威性差等诸多问题。如今,“汉字全息资源应用系统”的正式上线可能让他再不用犯难——借助资源库,“古今汉字任你查”已不再是梦想。

本期上线的系统涵盖字符集4种,其中常用字集3500字,通用规范字8105字,古籍印刷字16490字,全字符集81722字;还有辞书20种,古籍文献60种,历代字形图415675个。其中包括大量的图形信息资源和文本信息资源,分别来自古文字拓片、文字编、规范字表、编码字符集、历代辞书、经典文献、中小学语文教材等,涵盖了古今各个时期文字的形、音、义、用、码五大方面的重要信息。

这一数据库,可以说是“海量”。如此庞大的信息量,是如何做到相互对应、关联的呢?

如果说建立数据库是给汉字家族绘制一张家谱,那么建立关联则是搞清谱系、辈分等关系。“首先是汉字属性的分解。构建一个具有多角度关系的汉字实用数据库,必须以汉字的属性作为基本的依托。”北京师范大学教授王宁指出,团队从20世纪90年代开始总结汉字的属性,除形、音、义之外,还增加码、用两个部分。码是汉字在计算机中的编码,用是汉字的使用,而且做了大量的属性细化研究,这样就有条件将笼统的汉字个体的资源库,改造为汉字的属性库,解决关联的多角度问题。

王宁解释:“其次是层次的确立,根据‘汉字效用递减率’,我们将汉字分为常用-通用-适用-罕用-无用5个层。第一、二层次涵盖36000字,以外的字只存记忆,不做深度开发,这样一方面可以在应用中扩大有用信息的使用度,另一方面将垃圾信息、无用信息退出关联,不干扰有效信息的集合和调用。”

“再次就是中介的寻求,我们继承传统语言学的研究成果,以《说文解字》的9353个小篆及其重文为中介来关联。古文字的确切识读,绝大部分是从《说文》开始的,这样就保证了不同形制、不同字体、不同时代汉字的最大限度关联。”王宁补充道,正是依靠《说文》小篆这些“核心家族成员”作联系,汉字家族内部不同族群的谱系才得以绘制在一起。

沟通古今,提供汉字准确属性信息

实现让通用规范汉字沟通古文字、繁体字,是该资源库的又一重要特征。据介绍,系统的主体字集是国家语委2013年公布的《通用规范汉字表》的8105个规范汉字及其关联字形。《通用规范汉字表》属于简化字系统,分为一级字表(即常用字表,3500字)、二级字表(3000字)、三级字表(1605字)。《通用规范汉字表》作为数据库子库的B库,直接和A库(传承字、繁体字和隶定字)关联,进而与小篆等古文字(C库)关联,从而实现了古今、简繁汉字的有效贯通。

如何保证对收录的每个汉字形、音、义解释的权威性?

王立军介绍,系统的处理方法是:选取历代具有代表性的辞书,并选择最优的版本作为搭建框架的基础素材,以此为基础建构数据之间的深度关联。选择的辞书包括从《尔雅》《说文》《释名》《方言》《广韵》《集韵》《康熙字典》《汉语大字典》《新华字典》和《通用规范汉字字典》等。在字形方面,简化字的部首采用2009年国家语委发布的《汉字部首表》,即201个主形部首和99个附形部首,非简化字采用214部首体系,来源于《康熙字典》。简化字和繁体字的笔画数属性参考《通用规范汉字字典》等。结构类型(六书)属性参考《说文解字》。字音方面,现代汉语拼音和注音字母主要参考《通用规范汉字字典》和民国时期《国语辞典》等;近代音来源于《中原音韵》;中古音来源于《广韵》。字义方面,常用义项来源于《通用规范汉字字典》,并给出历代辞书的释义内容。

多种属性的综合呈现,可以加深人们对每个汉字的理解。比如“既然”的“既”和“即使”的“即”,在使用过程中容易混淆,但参考小篆字形就不会了——“既”是一个人背对着饭桌,表示吃完了,这个字就是表示已经发生了;而“即”是一个人正对着饭桌,靠近它,还没吃饭,所以是表示即将进行的。了解了这一层面,理解就加深了,也就很难出错了。

汉字不是一个个“孤零零”的符号,汉语文献正像躯体的血肉,丰富着汉字殿堂的内容。在每个字的“用例”一栏,系统选取具有代表性的传世文献作为古籍用例的来源,包括十三经、二十五史、二十二子等三大典籍系统,提取汉字在这些文献中的使用例句,供研究者参考使用。

多种检索,满足不同用户需求

与查字典类似,方便检索也是系统的一大特征。为方便使用者更便捷地输入需要检索的字,系统提供了单字、拼音、部首、部件、笔画等五种可输入的检索方式,使用者可以根据自己的喜好和需求,选取适合自己的方式。除单字检索外,还可以满足综合检索、专书检索和历代字形检索。

“你看,‘典’字是两只手捧着书卷,这多么形象,对于文史研究者来说用于研究也太方便了,我现在就想拥有。”刚刚演示完动画,现场主持人、北京师范大学文学院教授康震兴奋地说。

“资源库可作为文字和文化爱好者提高文化知识和综合素养的学习平台,为传统文化爱好者提供权威的学习内容;可以作为基础教育及汉语国际教育领域的教学平台,为学生学习、教师备课提供丰富的教学资源,从而更好地服务我国基础教育;可作为文字学及相关专业领域专家学者的科研平台,为专家学者提供对数据资源进行深度挖掘的工具,弥补传统手工获取资源、联系资源方式的局限;可作为汉字类数字化产品的开发平台,为开发者提供海量的经过专业学术加工的可靠汉字属性资源。”王立军指出。(记者 周世祥 靳晓燕)

《光明日报》( 2019年01月27日 04版)

相关资讯

汉字三部大字典:大汉和辞典、中华大辞典和汉语大字典

汉字称得上大部头的字典有三部,一部是上个世纪六十年代日本人诸桥彻次编纂的《大汉和辞典》,一部是七十年代台湾出版的《中华大辞典》,第三部就是1986年出版的《汉语大字典》。感谢书籍电子化,不然这样大部头的书,普通人是无法得见的。日本的《大汉和

被誉为字典的始祖,首部汉字字典,你了解多少?

东汉经学家、文字学家许慎撰写的《说文解字》是我国首部以六书的观点为基础来阐释字形、分析字义的字典。《说文解字》将多数先秦字体及秦汉两代文字的训诂成果保留了下来,再现了古汉语词汇,有层次地阐释了关于文字的观点,因此被誉为我国文字学史上首部评析

越南为什么全面废除汉字?汉字在越南还有复兴的可能吗?

越南是东南亚唯一一个汉字文化圈的成员,和朝鲜、日本一样,都曾将汉字作为书写语言。秦朝时,越南北方被纳入中国版图,汉字也随着传入。到唐朝末年,越南北方尽管独立出中国,但在“尊汉”思想下,汉字依然是越南官方签署法令、选拔考试的通用文字。▲汉字文

中华汉字真神奇!古代测字故事,体悟汉字的神奇魅力

“仓颉造字,鬼神哭”,自从仓颉造字以后,世上就有了文字。而随着文字的出现,也便出现了文字崇拜。因此,不仅文字的起源被蒙上了一层神秘的色彩,而且文字本身也被赋予了某种神秘的力量,或者蕴含着命运的枢机,或者预示着神鬼的意志。于是,人们便解拆字形

测字。汉字,是世界上最神奇的文字。学习测字,汉字博大精深...

序言中华文字——汉字,我认为是世界上最神奇的文字,表音,表义,表形之外,内含阴阳乾坤。是其他文字,特别是西方和其他国家表音文字不具备的。先说表音和表意,中国为什么会是一个统一的国家,欧洲为什么会是一群国家,跟源在于文字。地方一大,就会形成方

汉字文化:整理可释义汉字单字近14万

汉字究竟有多少个,至今未能确知,整理可释义的汉字单字(含异体字),可达14万个汗青 整理夏商陶文,约500字。商代甲骨文,有3500—4500字。《训纂编》,西汉扬雄纂,收字2040个。《说文解字》,东汉许慎著,121年成书。收小篆9353

平面设计离不开汉字!汉字设计诀窍

平面设计的工作几乎离不开文字,基本上所有的设计都会涉及具体的字形设计,不管是标准字还是美术字。有时候现有字库中的字体,使用前都需要改动,甚至重新设计,才能满足设计的要求。其实,字体设计所牵扯的范围很大,我们并不需要去大量了解这方面的知识,我

楷行草四体书法字典,收录2500常用汉字(1—100页)

#pgc-card .pgc-card-href { text-decoration: none; outline: none; display: block; width:

汉字的温度,满满的回忆,那些年你用过的《新华字典》版本大全

从咿呀学语到顺利毕业,每个人在学校的启蒙教育都至关重要,而每个人的入学教育也都会随着一本《新华字典》拉开序幕。小编读小学那会儿,《新华字典》工具书和书包文具的重要性是一样的,堪称入学标配。因为汉语学习的基础性和重要性,基本上每一代人学习汉语

楷行草四体书法字典(100-200),共收录2500常用汉字

用好工具书,快乐学汉字——昌图镇铁北小学开展查字典比赛活动

《新华字典》是我国第一部以词汇规范和运用为旨归的字典。它被盛赞为“小字典大作用”。它见证和记录了从新中国扫盲、促进汉字改革到推广普通话和现代汉语规范化的全过程,《新华字典》获得了“最受欢迎的字典”和“最畅销的书”两项吉尼斯世界纪录。查字典是

楷行草四体书法字典(400页-600页)共收录2500常用汉字

一本字典,带你走进三千汉字的前世今生

一位研究汉字的老外火了——他就是“汉字叔叔”理查德·西尔斯。这个面容憨厚的外国大叔,是“汉字字源”网站的创办者,他用信息化的技术,将近10万个古代中文字形收录在“汉字字源”的网站,网站的用户遍布全球170多个国家和地区。他曾在采访中说:“每

楷行草四体书法字典,计500页,共收录2500常用汉字(200-300页)

我们究竟有多少汉字?以及几本再也找不回的字典

殷商甲骨文现已发现单字4500个。其中可识别的约有2000个。甲骨文是镌刻或写在龟甲和兽骨上的文字。出土在河南安阳小屯村一带,因为这里曾是商代后期商王盘庚至帝辛的都城,史称为"殷"。商灭国,遂成为了废墟,后人便以"殷墟"名之。因此,甲骨文也

友情链接

网址导航 SEO域名抢注宝宝起名网妈妈知道币圈今日聊城刷卡机品牌网庄达菲歌迷网园林景观网桂圆龙眼网南宁交友相亲网车主网清江画廊资讯网柳州螺蛳粉官网鄂州新闻头条网云南旅游网崇左石林旅游网海尔空调资讯网PS抠图网生肖兔运势网
汉语新华字典-汉语字典为您提供拼音查字、部首查字、笔画查字等,新华字典是中国第一本按汉语拼音音序排列的小型字典,康熙字典是清朝康熙年间由张玉书、陈廷敬等三十多位学者自康熙四十九年(1710年)到康熙五十五年(1716年),历时六年编撰完成的一部字典。
汉语新华字典 meijixian.cn ©2022-2028版权所有