womdoubangding中文是elewom什么意思思

请选择错误类型(可多选):
其他错误(选填):豆丁微信公众号
君,已阅读到文档的结尾了呢~~
围产期B群链球菌感染及预防的研究进展,围产期,围产期心肌病,围产期是什么意思,围产期保健,围产期保健手册,围产期保健档案,围产期注意事项,链球菌感染,链球菌感染的症状
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
围产期B群链球菌感染及预防的研究进展
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口矮小人“相亲会”袖珍先生找到豌豆公主
原标题:矮小人“相亲会”袖珍先生找到豌豆公主
华西都市报讯(记者王浩野)前日早上10点多,汪家拐街道办事处少城社区的一个茶楼里,来自全国各地的20多个矮小人来到这里参加“相亲会”兼“联谊会”。发起人之一的毛小莲身高不足1米,是四川矮小人联谊会的会长。重庆人、东北人、浙江人……身高1米出头的矮小人们依靠网络互相通知相亲会的信息,最终赶来参加的人从20岁到30多岁都有。前天早上8点,身高1.3米的罗先生精心打扮了一番,从金堂坐车往天府广场赶。进入茶楼时,他领到了一支手工的玫瑰花。“表白的时候用。”工作人员告诉他。茶楼中央早就搭建起了舞台,这些长着娃娃脸的矮小人们一一上前进行自我介绍,姓名、年龄、爱好、对未来的打算……不限时间不限内容。现场还设置了游戏环节,男士女士一组上前抽扑克牌,抽中相同花色的进行真心话或大冒险。从10点多一直玩到近12点,一开始还比较尴尬的会场逐渐热闹起来,大家也坐在一起聊开了。最后的表白环节,罗先生将自己的玫瑰花递给了来自云南的李女士,同是88年出生的他们之前在网络上聊过天,也见过一次面。“我对她印象很好,不表白怕以后没有机会了。”
用手机随时随地看新闻
独家独到独立
用户名&&密码所有评论仅代表网友意见,凤凰网保持中立 
04/21 07:02
04/21 07:02
04/21 07:02
04/21 06:49
04/21 11:28
03/09 16:46
02/24 09:56
03/09 16:45
03/09 16:45
02/27 16:10
03/13 08:17
03/12 08:43
03/12 07:22
03/12 07:57
03/20 09:48
09/07 09:38
09/07 09:38
09/07 09:39
09/07 09:39
09/07 09:39
04/26 09:49
04/23 08:47
04/23 08:57
04/23 09:14
04/23 09:22
48小时点击排行
财经 · 房产
娱乐 · 时尚
汽车 · 旅游
科技 · 健康情侣消消乐 隆重上线
账号同步,携手闯关,甜蜜多多!
不仅考技术,还要拼智商!
小心萌到一脸血哟~
内嵌单人模式,偶们不虐单身狗!
游戏即将发布
发布当天赠送价值28元大礼包!
1天20小时30分30秒以下是我去年在《汉语拼音与输入法论坛》发表的部分文章摘录,仅供参考。========= 关于拼音文字的讨论摘录 ======谢振斌回复吴耐先生===你这个方案和我以前设计的比较接近,至少很多思路接近了,只是具体化的设计还是很多不够完美。比如部件分类还差一点,不够完美。我已经好几年没有研究这些了,这两天心血来潮又进到这里看一下,没想到论坛还是和几年前差不多,五花八门的方案都有,有些根本就行不通,也没有理论基础。真佩服这些人坚忍不拔的精神:)几年前看了班门斧的一篇《也谈汉语的拼音文字化》,里面的观点我倒是颇为赞同。关于我的思想,我在1993.3的《中文信息》上写的一篇《汉语特点与拼音文字》里面已经阐明了。里面有我的主要观点和对拼音文字设计的思路。......在此只想重申一下我的重点,详细的思想可以看看93.3《中文信息》上的拙文。至于具体的方案细节我还是不太愿意公布。一、设计原则:1)必须具备文字的素质和特点(音形义的科学化和统一、美观的外形、辨认和表达力强)。2)必须能够继承中华的文化(古文、诗歌、成语等都能继承和适应)。3)必须科学和系统(必须有足够的理论依据和统计数据支持)。4)必须真正弥补汉字的不足(便于输入、音形统一、便于学习)。二、设计思路:1)语音是基础,必须继承。2)必须基于26个拉丁字母。3)词是语法基本单位,但根据汉语的特点,仍然必须解决好单字的问题。(原因这里不细述)4)由于语音系统和文字系统空间的差距,必须设法提升语音系统的码空间,也就是同音字的异化和义化。5)精雕细琢若干高频词(比如500个),这500个高频词的挑选依据为:实用频度、构词能力、虚词优先、词缀。6) 制定基本拼音文字基本集,每个汉字由“表音的主体+表义的词缀”构成。表义科学合理,部分兼有标调能力,但不能干扰表音部件,影响文字辨识。6)推行过程,不要指望一蹴而就,如果国家愿意出面,首批发布可以只是前面500个高频词,。剩余的文字保持方块字,也就是混合书写,允许在适当的领域试行。7)如果时机成熟,就发布拼音文字基本集:大约。这个基本集不需要任何记忆,是根据规则而来的。同时发布正词法、罕用字规则、成语和俗语规则。原则上常用词、紧连词要连写,而非常用词、松连词要加分隔符“-”,成语虽为紧连词但也要分隔符。举几个我当初设计方案里面高频词的例子:词 词频 普通原则 高频定型== ====== ========= =======的 69080 de de ('d)了 26342 liaov le是 20401 shir sh一 19589 yi yi (e)不 15757 bur boo在 13438 zair zae有 12238 youv yow我 11699 wov wo个 10303 ger ger他 10017 ta ta就 9285 jiur jio这 9139 zher zhe着 8549 zhuol zh上 7663 shamv sarm说 7648 shuo shuo人 7315 renl ren和 7014 hel hel地 6522 dir dee ('d)也 6405 yev yew你 6103 niv niv我们 5279 wovmen wom (wo'm)到 5268 daor daw大 5202 dar daa里 5195 liv liv都 5038 dou dow去 4323 qvr quu本贴由freeman于日21:44:04在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表.======我的拼音文字思路--------------------------------------------------------------------------------已经两三年没有进到这个论坛,也没有继续我原来的研究。这两天进来看一下,面貌依旧,但看到大家热情不减,也是颇为感动。翻了这两天的帖子,看到 会员吴耐 设计的方案,我有些眼前一亮,和我多年前的方案有异曲同工之妙。虽然具体的支末细节上还是差异不小,但是最关键的是思路基本一致了。在此我表示极大的支持和关注。我想其实所谓的科学性,就是你必须说出道理,并且有足够的统计资料作为支撑。这一点他的文章里有所体现,这也是我欣赏的原因之一。关于我的设计思想,这些年零散记录了一些,但发表的很少。除了《中文信息》93年第三期算是稍微全面的提了一下,但是也只是阐述一些思路,没有公布具体细节。一方面是因为细节一直在细化和完善,我都编了自动转换软件,试了早期设计的规则和码表,出来的拼文,我自己都还是不够满意。但是我知道剩下的工作在哪里,我知道出路在哪里。还有一些统计和归纳的工作需要做,一些细微的设计需要定型,周边的连带问题需要解决。在这里,浅显一点,叙述一下我的思路历程,仅供参考:1)码元的选择只能是26个拉丁字母,这里就不详细论证了。2)语音的继承,也是毫无疑问,这也是前提之一。包括声调,也是必定要包含的。(原本语音空间就很小,怎么可能不包含呢, 这里不想浪费笔墨说更多的原因)。3)接下来自然就是 “语音空间”与“方块汉字”空间的巨大反差问题的解决方案问题了。4)无论如何, 拼音文字表音是主体,表意是附属。在这个前提下,接着的思路才有意义。反之,就要进入我的另一个研究课题“表形文字”,也就是说要是允许表义作为主体,那么我早期设计的一个“新全息码”完全可以满足需求,那是一个基于规范部首的文字方案。对此有兴趣的话我可以另文阐述。5)“汉语拼音方案”显然担不起文字的重担。于是我们可以回到国际社会观察一下。当然最主要的就是看看英语。于是我们可以得到不少启发,从英文里面同音不同形的音节很普遍,我们完全可以仿效,形成所谓的“异拼”吧。这部分的设计,完全可以让“表音空间”扩大好几倍了。6)可是差距仍然很大,更重要的是音节实用频度分布不均匀。有一些音节明显重码过高。仍然需要异拼的精心调节和寻找进一步的分化办法。7)于是自然就会想到文字三要素“音形义”的另外两个要素。显然这里“形”已经没了依据,因为这里不是继承汉字的字型。所以自然就是考虑“义”,于是我们需要设计“义符”来辅助表音系统,进一步分化同音字。这些义符就好像英文里面的不发音部件。不能多,也不能干扰我们的表音主体。8)关于义符设计其实需要长篇论述才能说清,这里只能试着简要提一下。9)在我设计“新全息码”时专门研究了汉字字型的特点和演变。汉字的像形和形声中的形部就成了我关注的对象。最终,我认为“部首”是义符的主要基础。于是我花了很多的时间,统计了大量的中文和英文资料,归纳分类,最终合理地科学地把全部的部首映射到26个字母上面去。而且是双射不是单射(有疑问的这里也不细述了,当初原本也是要发表到《中文信息》,但是他们要我交一笔钱,我还是放弃了)。10)到此,好像结束了。不,其实这才是刚刚开始,具体化的过程中会派生出不少的问题需要进一步细化规则。比如:外观的美感和统筹、异拼的科学化、义符的取舍原则、构词原则、书写原则(连写原则等)、专有名词和外来语的方案、罕用字的规则等等。而这些本身可做的工作太多了,以至于我没有全部做完。11)所以才有我一路强调的“精雕高频字词,首批发布不要多”、“规范基本集,作为其次发布”、“允许和方块字混合书写”、“通用规则简单而明了,适应全部常用字词”、“罕用字原则上不使用,非用不可时可以保留方块字形式,除非系统尚不支持混合模式,那么按照通行规则转换”等思想。我目前未完成的工作在于:1)异拼的统计归纳未做完,所以仍然很多改进空间。2)义符的取舍原则,义符虽然可以直接取自我设计“新全息码”的成果,但是不能简单套用,必须取舍,否则一定会干扰表音部件,大大降低整体效果。3)必要时考虑义符和声调甚至声韵母的某种揉合,最后形成更加漂亮的定型“音义符”。4)对于高构词力的词根词缀和高频虚词,必须给予特别关注,使得他们的外形“简短、美观、易认、定型”,这也是重点和难点。本贴由freeman于日00:44:28在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======关于“意符”设计--------------------------------------------------------------------------------关于你提到的部首分类问题, 如归类的不确定性等.这个问题 正好在我的部首分类法中得到了很好的解决.更加可贵的是, 我不但做到了见字识码, 而且做到了见码识字, 也就是说, 他们是一一对应的关系(双射), 而不是象常见的编码那样一码多&部件&.当初设计部首分类时, 主体是围绕着&拼形文字&这个目标, 所以我统计了大量的英文首字母/次字母/字母联合/词尾等的频度,包括动静态频度. 由此为依据来分配字母映射, 使得最后的拼形文字, 看起来更加象英文, 但又不是英文(应尽量避免与英文重码,以免混淆,在拼音文字里这个一样要注意).但因为当时字母映射的目标是拼形文字,所以很多考虑的东西并不完全适合&拼音文字&.需要重新映射和考察. 原因有:1)拼音文字主体是&表音&, 义符只是辅助成分, 不发音, 所以应该尽量避免干扰发音, 特别是原来拼形里允许的元音字母,现在就有点麻烦了, 它会干扰&表音&.2)3) 为了避免文字的过度冗长, 义符一般也只采纳单字符方式, 少部分考虑双字符方式.但如此一来就难以达到定型的目标, 也就是我那篇文章里提到的&有型&, 就是有自己固有的外型特征, 好比英文里面-ght -ing -er等词根或后缀.针对3)的问题, 一个出路是设法把义符和表音体融合, 产生&音义部件&. 否则只好忍受义符对外型的损害效应了.本贴由freeman于日18:43:45在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表.======大致说一下我对《史美汉拼方案》的看法--------------------------------------------------------------------------------感谢班门斧先生介绍的资料。粗略看了一遍,郭致平先生的文章没看到他的思想内容,所以不是很明白他说叙述的东西,暂不讨论。而“史美汉拼方案”倒是看明白了他的思想和做法。下面就略谈一下自己的一些看法。一、我不主张用反切方式来创造新的“声旁”。我更愿意主张使用现有的表音部件。二、至于文中的新方块字思想,其实我一直留有这方面的思考,如果对我的文字有细心留意过的话,一定会发现这一点。首先拙文《汉语特点与拼音文字》的最后一段文字就提到了是否可以考虑返回来把设计好的带有“音形义”统一体的拼音文字,重新映射到方块字的形式,形成新的规范方块字。其次拙文《新全息码》的开头引言,也写道:“此外, 基于此方案也可以派生出规范方块字,当然,是否有意义,尚值商榷。”以上两篇文字,见前天帖子。可见对于我的拼音和拼形方案,我都有作这方面的考虑,只是把它放在次要位置,而且我希望听到更多人的意见。其实方块字的好处主要在于“外形”,也就是平面结构的外形具有更多辨识信息和艺术美感,信息密度也比较高。但目前改革的核心与重点是如何将文字代码化,也就是变成规范的一维的码元符号,这方面是一致的,无论最终想怎样书写。也就是如何将旧方块字的“无序部件组合”变成“有序部件组合”。三、至于拼形和拼音,则是各有优缺点。拼形的好处是,外观上甚至可以很少改变(新全息码),大大继承原有的文字优点。但缺点是表音能力弱(如果愿意的化可以加强,但全息就要削弱)。而拼音方案正好相反,它准确负载了语音信息,但是字形信息被削弱了。我主要是考虑拉丁字母形式时必须削弱“形符”,以免干扰表音功能。但这不是说没有折衷方案,如果像我那篇文章所说的,考虑用方块字的形式来拼写新拼音文字的话,那么这些问题也就迎刃而解了。因为义符我已经很好地归类了,剩下的工作就是把表音部件进行“图形化”,也就是相当于形声字的“声旁”了(我倾向于使用现有的声旁资源为主)。由此可见,实际上我们设计的拼音文字,本身就相当于形声字,除了那些特高频词外。原文还有一些细节我不是十分赞同,这里就不细述了。综上所述,目前有所值得商榷的是,是以下两个大问题:1)应该用方块字形式表达新文字,还是以拉丁字母表达新文字?2)应该以重视表音功能还是表义功能?也就是说我们的最终期望和目的是什么?我们希望达到什么样的目标?这个问题,希望大家说说自己的看法。我个人目前是倾向于“表音的拉丁形式”,但我的设计实际上都涉及考虑了其它几种变种形式,也不时地连带思考了相关的问题。我提出的两种新文字,自己认为还是比较合理科学和可行的, 整体构思也比较严谨。迟一些时候我抽出时间系统整理一下,再与大家探讨。暂无细节提供, 望谅。(不过我可以用早期编写的自动转换工具翻译几篇样本贴出来参考一下)#Freeman Tse 本贴由freeman于日20:01:12在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表.=======就“纯拉丁化拼音文字方案”与吴先生一起探讨大致浏览了一下你的系列文章(1)-(6),由于我目前时间不多,所以不少细节可能被我忽视或略过,这里就我看到的一点问题,谈谈一些看法,希望我们能共同努力,把事情做得更好。关于你的整体思路我基本上是赞同的,异拼归纳的过程也还算科学。这里就文中的一些细节谈一下我的想法以及我的做法,供你参考。一、异拼的选材范围还可以拓宽,你目前考察的面还是不够。原则如下:1)先不管声调和长度(通常是1-3字母)。2)参照各种现存的拼音习惯或者文字发音习惯,主要是英语。3)不冲突: 就是规则之间不要冲突。4)不歧义: 就是不容易被错读或错认为其他读音。凡此种种皆可做为考察对象。我以前的做法是:1)罗列了全部双字母,并人为定音。2)排序整理和归纳,并统一化。3)寻找基本规律,指定一批规则。4)大量统计音节动静态频度和组合频度,并且与英文对照,然后调整自己的设计。5)人为细调高频词。6)根据细调后的高频词再次细调修正基本规则。7)细化音调规则8)细化与“义符”的组合规则,或“音义符”的规则。关于三字母的部分工作我未完成。二、尽量吸收目前世界流行的拼音或注音法则。特别地,应该从英文中吸收更多的养分。你目前的方法产生出来的一些异拼形式,我感觉还是不是很顺,看看是否改进一下。1)有些已经不错,如ee=i,oo=u, 和我的方案一致。但iu=v个人感觉不是很好,我的方案里有uu=v和yu=v等。2) 我留意到你对ng后鼻音的处理。我觉得m=ng是很好的方案,不知为何没有被你考虑?3)半元音字母n m l y w等好像考虑得还不太够。4)辅音组合考虑不够。5)容易拼成其他音的组合尽量避免,即使拼出来的音不存在也尽量不要用。6)拼起来很别扭的元音组合,个人认为要尽量避免。当然这个尚值商榷。7) 过于注重规则,结果导致规则越来越复杂,反过来合理性越来越低。规则应该留到第二阶段总结和归纳。三、重视外观效果。也就是说要把外观放在很重要的位置,因为最终是要给人家阅读用的。这方面需下的功夫最多,需要结合很多因素考虑。四、重视静态频度和动态频度。做好一些频度统计,包括汉字、汉词、构词、英文等,以及新文字与英文的比对工作。我看到了你也做了一些这样的工作,如义符的使用比例等等,还不错。五、重点放在高频词上。1000个左右的高频词就可以覆盖80%的实用频度,所以我们要重点考虑。也就是20-80原则,考虑好这20%的高频词,也就做好了80%的工作。六、关于声调的分配,我暂时不评论,因为我自己也还没有定案。但我看到了我们很多标调是不一致的。我唯一能告诉你的还是那一句,从国际惯例中吸取养分。七、轻声、变读、儿化、多音字、一字多义等问题:1)轻声数量很少,基本上可以归入阴平处理。2) 组词中的变调情况,可以按照实际读音来改变外形,本规则仅适用于紧连词(或称紧粘词),也就是你文中的紧词。3) 多音字,自然地被分化为不同的文字。4)一字多音:对于高频部分,可以考虑分化这些成分,使用不用的文字代替, 也就是造新字。5)儿化音,不需要单独考虑。和其他高构词能力的词根词缀同等处理。如“-子”“-机”“电-”等等。八、正词法:1)你提到的组词时,把义符集中到尾部,这个我认为不可取。2)你的义符省略规则我也不太赞同。参考拙文《汉...》。4)关于分词连写的规则。 基本赞同,不过好像没有看到你对成语的叙述。而我是多处特地强调了成语的处理方式。按照组词的紧密程度,成语原本应该属于紧粘词(这是我的习惯称谓,有时称“紧连词”的说法,和你称味基本一致),但是成语的一些特殊性,还是按照松粘词处理,主要依据是:词频、字数、成语数量、外观辨识。现代汉语多数倾向于双字词与三字词,而三字词多数具有偏正关系,所以一般紧粘词都是双字词,而且频度统计也揭示和印证了这一语言特征。还是那句话“精雕高频字词,余下部分规则合成”。5) 专有名词的处理,这个我同意,按照国际惯例即可。6)关于外来语,我们也许有些分歧,因为我不强调必须音译。不过这个已经不太重要,因为真正的使用可由不得你,看看现在网络语言的演变就知道群众的力量,所以这个都是次要问题。7)至于语法、计数表示等等上层的东西,一样,都是不需要操心的问题,一律原样继承即可。原因同上。九、关于义符,昨天的回帖已经大致提到了。此外由于我的部首分类细节暂时不便公布,所以这方面就就留以后进一步讨论。唯一提醒的一点就是,我多处提到的“音义符”,这也是我自己一直未完成和确定的工作,但我认为值得思考。#Freeman Tse ======解释一下--------------------------------------------------------------------------------1)关于“如何衡量文字是否具备美感、科学”,目前没有什么标准,只是我们多少可以有一些常识或者主观的感觉吧。即便如此也就足够了。因为大众也是凭主观意识去感受的,不可能都研究入微,我们只不过多一些研究其中的道理,发现多一些的规律而已。2)关于吸收英文的养分,不是指外形要一致。但事实上即便大量采用英文的音节构成规则也很少会出现冲突情景。你应该看到,我有两次跟你回复中提到,要注意尽量不要与英文重码。因为我是赞同允许中文混合拼写的。反之,我却看到你的规则里,好像不太赞同外来语直接原型引用。======我的构想里不是通过词缀来区分同音字或同音词~--------------------------------------------------------------------------------研究这些高构词能力的词根词缀,目的是为了“精选高频字词”。要知道同样是高频词,他们有很多特性不同的。比如有些构词能力很低。有些构词能力很高。有些是实词,有些是虚词,有些适合叠音有些则不适合,等等。只有把这些属性充分考察一下,才可以给他们赋予更加合理的外形。本贴由freeman于日19:58:29在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======是的,我现在也清楚了你我方案的区别所在。--------------------------------------------------------------------------------留意之前我说过的:1)第一阶段解决高频字词,怎么好看、怎么舒服就怎么设计。这就是我说的“精雕高频字词”。2)先不要管规则,而后才总结归纳。3)我还说过:高频词取自词频表最高的的那些、字频表最高那些、高构词词根词缀、虚词优先。你可能会发现里面一些无规则,甚至矛盾的地方,因为我那个码表还没有调整,出现不合理之处一定不少,比如har=化,我早已经否决了,这个只是早期乱打进去的,当时头脑里想的是高频词能短则短,后期其实很多都被我否则掉。有时间我再细聊一下我们的区别。不过,我虽然吸收英语的音素,但是我也是和汉语拼音兼容的,这点我怕你误会。你是规则在先,重规则。我是规则在后,重频度和外观。说白了,我最后的结果是,只需要学习和记忆高频(约500-1000)(外形漂亮所以这个不难)。基本集不需记忆,只需记住因素拼写规则,和组词规则即可。首批发布就是高频词(500-1000), 这个适应了以后再发布基本集。...本贴由freeman于日19:16:42在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======补充一下。--------------------------------------------------------------------------------千万必要误会,我指看重词根,他只是我选择高频集的一个域。但是确实它必须重视。否则你会被汉语构词的随意性和灵活性搞死:)此外“tien=天”我不认为违背汉语拼音。这个我现在还是喜欢。还有一点,就是高频词我很多都省略了音调,所以上次和你聊的变音问题,基本上就很少了。还有我的方案里面有可能同一个形状的音素在不同的环境下有不同的发音,但是规则明确,比如是和某声母或者和别的什么在一起的时候,这个我还没整理。本贴由freeman于日19:25:54在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======是的,一定要考虑传统文化,不能太复杂--------------------------------------------------------------------------------一些考虑像英文那样,带有词性甚至很多语法变化等,那是不符合汉语特点的。汉语的基础元素是单字,这个很难改变。汉语的语法规则,也不要指望轻易改变,大众不会接受的。我的步骤将是:1)发布基础集, 计划覆盖90%左右,按我说的范围去挑选高频字词,估计在500-1000字左右。2)发布基本集,计划覆盖99%左右,这些字根据字频度挑选。本贴由freeman于日19:26:45在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======你说的也有道理,这方面会仔细考察在权衡合理范围--------------------------------------------------------------------------------我总体原则也是不要让外形变来变去,所以基本上会考虑不随意因为变音而改变外形。再说变音一般都是有规律的,基于这一点,确实如你所说不需要每个词连写是改变音调。那样的词太多了。如果某双音词被收入高频集部分,那么有可能根据实际情况指定它最适合的外形。除此之外,基本集是严格按照规则实施的,不做太多特殊规则。具体情况等高频集做完了,在细加考察。本贴由freeman于日19:11:35在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======关于“成语和变音”补充回复吴耐先生--------------------------------------------------------------------------------致吴先生(补充之前的回复):我翻阅一些陈年旧稿, 看到一些当时关于成语和变音的想法,摘略如下:& 四字词 成语的 表示: 用'-'连接各单字.& 成语: 通常使用连接号: mim-fu-qi-sh 名副其实 femfur-docay丰富多彩komqan-johou (johou-komqan) 空前绝后& 松粘词: 使用连接号: 进一步 jirm-yibuu 地平线 dee-pim-xarn 地下室 deexar-shr工程师 gomchem-shi 工程部 gomchem-buu& 如果单字在组词中需要变音 则省却声调 或按变调标音:14: 一(/)定 yidrim idim 44: 不(/)必 bubri 24: 革(v)命 gemim 33: 老(/)板 laobvan& 词语的前一音通常不标调(特别是会变音者), 如:阳平+上声 上声+上声 阳平+? 上声+? 阴平+去声总结:成语多数使用连接符'-', 但也不绝对, 有些不是, 有些局部粘合. 其实最终指导原则还是我那篇文章提到的&精雕高频字词, 余下原样合成&.变音也是如此, 目前前期应该局限在高频部份, 而不是所有的紧粘词都如此.其余部分在实践中自然演变.由于实际上考虑了高频词首字省略标调, 这就解决了大部份变音的矛盾.本贴由freeman于日19:29:37在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======回复吴耐先生--------------------------------------------------------------------------------【1)2个元音所能够组合成异拼已经被我用光了.剩下的恐怕就是3个元音的了,但是3个我觉得太长了,所以没有采用.】原先的韵母系统已经有超过2字母的呀,如iao、iong等等,所以还是要考虑进去比较好。【2)半元音"v","l","m",没有采用.以后的方案可以考虑.但我也不想异拼太多,太多已经用处不大.单韵母到是需要更多的拼式,但是增加这些字母来增加异拼数量并不能解决问题.】我倒是希望越多越好,这样我可选空间更大。和你的构思不同,你是用同一个规则定义,我则对高频集要求很松,越个性化越好,但又不失基本规律。【3)为了与原汉语拼音尽量兼容,所以没有用"m"来代替"ng".但是我确实考虑过.】我感觉和原有拼音没有冲突。【4)我的异拼发音规则是有一个总要求的,那就是与汉语拼音原方案不冲突.所以在我的这个方案里,所有异拼拼式都能够用组成它的字母(声母,介母,韵母)拼读出来.唯一的例外来自于异拼"ee","oo","ea",这3个取自于英语的异拼.】这个要求是肯定的,我们目标都是要见字识音的嘛。所以需要明确的发音规则。不过我的规则宽松很多。【5)我没有使用声母异拼.原因是声母异拼几乎都要增加字母,还不如用意符.】这个我们考虑不同。我是不管声母韵母,能变则变。【6)其他方面,比如细调高频词,我不知道先生是如何做的.我的感觉是没有必要.因为我的首要考虑是规则必须统一简单,不能为高频词制定一套特殊规则.】我们是在制造新文字,不是在做输入法,所以这点很重要。否则难以推广使用。至于少量的无规则,也仅仅500个汉字而已,容易学习得很,学会了忘不了,还很有成就感:)比起学习五笔输入什么的要容易上百倍。【7)你说,"拼起来很别扭的元音组合,个人认为要尽量避免"。这个我也想过.我自己感觉别扭的几个元音组合是"ae","aen","aeng","ain","aing","ein","eing","eo".现在拿出来也是想看看大家的反应如何.】ae组合我不觉的别扭,反而特别喜欢,视为珍品:)【8)你说,"容易拼成其他音的组合尽量避免,即使拼出来的音不存在也尽量不要用。"这个我也考虑过.其中拼音不是太合理的,主要是"gi*=g*".我觉得其他拼式没有问题.当然了,我说得合理,是指我的拼读仍然基于汉语拼音方案,而不是英语.】我也不是要基于英语,而是“在不会被熟悉汉语拼音的人误读的情况下,引入一些英语的惯用音节。”【9)你说,"组词中的变调情况,可以按照实际读音来改变外形",这个我不能同意.当两个3声字组成词的时候,第1个汉字都得变调.如果变调就要改变拼写,那么词形就不会稳定.】你说的对,我原文意思也是局限性的形变,不是都变,而且目前看来还是尽量不变。【10)关于分词连写的规则没有提到成语.我的实际规则比这更细,只是还没有整理完全,这篇文章只是摘要把大纲说了一下.】【11)"多音字,自然地被分化为不同的文字".我的方案正是如此.】【12)"你提到的组词时,把义符集中到尾部,这个我认为不可取。",确实值得好好研究.我自己也琢磨不定,犹豫不决.】【13)"你的义符省略规则我也不太赞同。"意符省略有2个原因.1个是为了初学者,另1个是为了向纯拼音过渡,只有纯拼才是最容易学习的.但是现在为了继承原汉字,又不得不区分同音字.但是我们一定要提供一个过渡通道.】因为你那样实际上就是使词形不稳定,所以不可取。本贴由freeman于日20:28:20在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表.======我的规则方块字思路--------------------------------------------------------------------------------单纯讨论规则方块字方案的话,我赞同使用规范的声旁作为表音部件。我在前些天回复班门斧先生的帖子(关于对史美汉拼方案的看法)里说过:“我不主张用反切方式来创造新的“声旁”。我更愿意主张使用现有的表音部件。”,就是阐明了这一观点。但问题是如何选择好现成的声旁呢?龙三先生的想法和音符表有一定道理,但是可以看到很多字实际上并非常见字,而且复杂,甚至不知如何拼读。这就带来很多的缺陷:1)替代高频字时容易造成歧义,像他列举的一些例句那样,好像在写白字、别字,比看不认识的字更难受。2)声旁复杂,带来书写和辨认的困难。因为这些声旁可以和一些部首(义符)构造出更多的汉字,所以应该力求简单美观。3)有些音节根本就只有一两个非常用字,而且外形复杂,没必要收入基本声旁表的。我的建议是:1)挑选一批,创造一批。也就是说一部分从现有的偏旁中挑选,部分另造。2)不一定必须是成字才可以。偏旁也可以,新创造的部件也可以。3)以简单、易辨、易读、美观为原则。4)每个音节可以与多个声旁对应。5)依然按照我那篇文章的指导原则构建新文字系统,也就是“精雕高频字词,规则构造常用字,淘汰罕用字。”6)和我的字母文字方案一些思想和规则可以互通。我始终认为:只有和实用频度挂钩的方案,才是最节省成本的,而且最容易推广和被接受的。这也是大家的方案比较忽视的方面。这点要说服大家的话,等我拿出我的定型后的方案在来讨论,那时不言自明。本贴由freeman于日15:26:35在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======我对分词连写的看法--------------------------------------------------------------------------------学术界一直争论分词连写的问题。这里大致说一下我的看法,供参考:一、我认为现有的方块汉字不需要连写!原因很简单,没有多少好处,只有很多坏处!好处是:消除一些歧义句子,便于阅读一些结构复杂的句子。坏处是:1)破坏现有的习惯,造成大众的不必要的负担。2)引发更多的不规范信息(即便国家强制制定规范,你又如何保障百姓老老实实做到?)3)现有的浩瀚的信息资料已是事实,这些资料长期不会消失的。人工改写是不可能的。而机器改写如果可能,那么就更不需要改写(因为你可以在你需要改写的时候或者阅读的时候按一下格式转换键即可)。4)分词连写其实外观更难看。普通文本如此,诗歌就更不用说了。5) 浪费资源,不过这个已是支末问题了。二、关于机器翻译的问题。有人提到的机器翻译问题,这只能说目前的机器翻译水准太低,和是否需要分词并无太大关系。搞过机器翻译的人一定赞同:即便你分词连写,目前翻译质量仍然很低,不会有任何明显提升的。其实除了极少数歧义的句子以外,我们人可以做到的分词,机器照样可以做到(我就可以编制自动分词的软件)。既然机器能做到,又何必把这样艰巨的任务交给人去做呢?那造机器干嘛呢?何况我们平常阅读没有觉得不分词理解很困难啊。即便说是为了机器翻译,试问我们几时书写的目的是为了要让机器去翻译,又试问即便现在分词连写,那么对于过往的信息资料怎么办?对于百姓不规范写出的半分词材料怎么办?我想这些复杂的状态只会让机器更加难处理,丝毫不会更轻松!其实机器翻译的根本出路还是在于机器智能的提高!3)拼音文字(指的是字母文字方案),自然是分词连写。但是,记住,不要那么刻板、死板!我之前多次强调“精雕高频字词、规则构造基本字、规则合成基本词”,本身就是一个容易实现的分词指导原则。除此规定原则之外,你爱怎么写就怎么写,不要费心去想这个是不是词啊,这个要不要加连接符啊!因为规则已经搞定了80-90的问题,至于剩下的10%你很难制定规则,原因如下:1)汉字构词灵活,词汇实在是海量,很多时候难以用简单规则约束所有的状况2)新造词、罕用词,一般是规则之外的事,所以我们不可能老在修改规则去适应。3)即便你规则明确,也难以约束所有大众的不规范,难以实用,难以操作!5)规范规定的都是高频的、实用的部分,这些数量很少(少量的定型词加少量的规则),但效能却很高,学习他根本不需要额外负担。6)与其搞一大堆规则这么累,不如抓住重点,忽略支末,给大众方便,也给语言自然发展制造空间。本贴由freeman于日16:14:21在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======要明确“字为基础”这个特点--------------------------------------------------------------------------------既然你假定&再&是zay, 当然“再见”里面也是用zay, 除非我文中提到的特殊高频词因为外形的需要而个性化修改。普通词的合成都有简单规则。再见=再+见=zae+jean=zaejean如果最终的定稿中“再见”被列为特高频常用词,那么也有可能再做个性化调整,这部分需要等我下一步的统计和规划做完。在我的构想中,字为基础,因为这是汉语不可改变的特点。但是现代汉语其实越来越多地倾向于使用双音词。这其实就是为了弥补语音体系编码空间的局限。一方面:很多单字本身就是词,如“但”“却”就意义明确了,可是现代汉语还是多采用“但是”、“可是”这样的双音词,特别是口语。原因就是便于理解,也有一些是音韵上的好处。所以这是必要的冗余。另一方面:很多单字词意义不够明确,如“编”可以是“编写”“编造”“编制”等等,显然后者意义更加精确,现代需要表达的意义原比古代精确,所以需要扩展。文言文是很精练,冗余度低,但是很难理解,容易二义、歧义。白话文就是根据口语交流的需要自然扩展,显然容易明白很多。同时我们也能发现,双音词构词实在太灵活了,以至于产生太多的同义词变种。3000单字+3000单字,理论上的组合是9百万,当然实际上不会这么多,但也说明了,只要增加一倍的码长,码空间就可以迅速扩充膨胀,导致丰富多彩的新词出现。其中利弊均有,总体还是利大于弊。我们必须重视这样的一些现象。关于这方面的话题,原本我想专门写一篇文章来讨论,不过目前实在没有时间,就简单提一下。本贴由freeman于日19:14:51在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======多谢鼓励和支持!--------------------------------------------------------------------------------由于该文章只是一个纲要,我力求道出基本思路,但是对于很多细节都谈的不够,只是略带而过,这是不足之处。这是较早期写的,有些过于浓缩和杂乱。我希望有机会再整理和细化一下,因为有一些地方后来有所变化或者更加明确化、系统化了。这几年我完全搁下了这些研究,我不知“异拼”一词谁先提出的,挺好的。我文中提到的“变读、省读、隐读”和“变读、多体部件”等就是这个概念,目的是分化同音字和增加辨识特征。特别是高频字词,我特别重视其漂亮的外观,一定要做到过目不忘的效果。关于您的交际语,我虽未能详细了解,但我感觉你加入了词性这个元素,可能会比较麻烦。因为很多汉字词性不是很明朗,有些可以多种词性,有些还需要和其他字组合时决定。词性一般来说已经隐含在义符里面,比如“打”“拿”的义符是“手”,就是动词。可是你可以看到“打”也可以是量词,“拍”也可以是量词和名词,如“三拍”“球拍”。仅供参考。本贴由freeman于日18:45:48在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======我支持你的观点,我随后会做更多的数据统计--------------------------------------------------------------------------------在我研究的拼音文字里,我也是需要做汉字分集规范工作的。推行拼音文字方案。我主张的是:“精雕高频字词、规则生成基本字、规则合成基本词、限用罕用字。”当然这里的高频不是单纯考虑实用字频,也会考虑字的本源、性质、构词能力等。纯粹为了拼音文字而定的高频集,我初定的数量应该在1000以下,而基本集估计就和班氏建议的“当用汉字集”差不多了。具体我希望等一些统计做完再进一步细论。我计划下一步进行更全面的词频统计,至少应该包括这几个领域:1)日常用语:语料来源于各大生活论坛,与大众生活密切相关。2)口语:语料来源于一些聊天室、灌水论坛等。3)新闻类:来源于新闻类文章。4)科技类:自然科学方面的文章。5)社科类:主要来源于文学论坛。其他的可以再补充,尽可能反映主流文化,兼顾深度与广度。统计素材量以产生足够精度、可信度为依据。争取每年做一次,以反应文化变迁引起的词频变迁趋势。各位有更好的意见和补充,也希望提出,共同探讨。有好的统计素材也望提供给我。本贴由freeman于日17:40:52在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表.======建议不错,详细回复如下--------------------------------------------------------------------------------【一,180万的样本,4000以后的低频字出现次数为一,偶然性太大。应扩大样本到千万,舍去出现次数三以下的低频字,得出备选集,再逐字过滤。】你说的没错。如果考察对象是高频部分,材料其实并不需要太多,但罕用字、汉用词就一定需要足够语料素材,此外选择的范围和方法是否科学也很关键。好在目前网络发达,资源还是相对比较丰富的,增加数量不难,可以分组统计然后看看两组的误差状况决定是否需要加量。不利的因素是目前网上多数材料是基于GB2312字集的,少数基于GBK和Unicode, GB18030就更少了。所以对于某些冷僻字是难以统计准确,不过好在我们主要目标还是放在较高频部分,对于冷僻字目前不加详细研究,个别的取舍人工主观判断即可。再说目前的字库因素本身就是一个限制因素,群众很难用到字集以外的汉字,这一点倒是和我们提倡的思路是一致的。【二,可代替的字,不应收入。如:暨同及。捱同挨。癍同斑。账同帐等。】这个理论上是这样,只是实施会比较困难。“帐”早就是“账”的替代字,但是由于电脑里账的地位并不输给帐,所以群众的习惯难以得到抑制,这个需要国家统筹考虑。好在目前我关心的主要是拼音文字化以后的范畴。那么这些问题就自然都迎刃而解了。【三,元素名,有机物结构名必需收入,但应保证以后不造新字。】这个同上,目前无需过多考虑,好在电脑字库本身制约了新造字的随意产生。我过去构想过可以在线点阵构字的内码方案,要是使用那样的方案,其实目前可以节省太多的资源,字集也不需要像目前那样拼命扩大。但那时也会容易被群众滥用来自造汉字(甚至制造图标等好玩的东西)。【四,多音字中意义不同的应分形而立。如:(长的繁体)長长chang。别bié;敝+弓biè。意义相同的应合并。如:烙luo正音。烙lao\ 北京方言。】这个在新的拼音文字里将不是问题。在传统方块字里问题同【二】彆=》别, 是简化的不良品。烙的的读音有些难办,这和很多方言一样,规范可以规定,但是民间异读仍然会存在,难以禁止的,但这应该视为合理的现象,虽然我们鼓励逐步规范标准读音。(普通人多数读luo, 我自己一直以为lao才是正音,听你这么一说我还真要找机会确认一下,可惜身边一本字典都没有)。【五,常用字的罕用意项也应限用。】这个恐怕也只有新文字可以有一定的修正。但即便新文字也难以杜绝类似现象的。不单字有多义,词一样有多义。而且很多意义是文化发展的产物,难以以个人意志为转移的。我举例来说。改革开放以后,广东以及港台很多地方方言进入内地,慢慢形成很多新的语言习惯,比如“炒鱿鱼”的语义,不是字面可以解决的。还有“靓”的语义也被大大改变了。这些我想只要不过分,都应该算是合理的。但目前网络社区有意写错字写白字的现象就应该是一种文化污染。比如“斑竹”“粉好看”“稀饭”“粉丝”等,这些就很不好,虽然它们也有它们特有的功效。可惜这个现象我看是很难制止,即便国家出面。本贴由freeman于日03:29:19在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======&&& 致“小虫”先生小虫&你两位的文改观点我深为赞同和佩服,我希望您二位能着手实施文改。大家总在这里空谈、互相攻击有什么意思?还不如静下心来扎扎实实做些实在的工作。如二位能联合起来,必能制定出一个很好的方案,届时我愿做一个志愿者试用,并帮您提出修改建议。&答复&感谢小虫的关注和支持。难得我们一些人有许多共同的认识和想法。这也使得我进一步增加信心和看到希望。吴耐先生的方案和思路有很多可取之处,和我的想法也有很多共同之处,我表示极大的支持和鼓励。我这段还是比较忙。稍后我会做进一步的整理,并公开一些细节,让大家共同讨论。大致的工作安排是:1)首先我要做的是一些资料统计:过去我基于不少资料做过不少统计,也找来了不少现成的统计成果,如《频率词典》等。但总体感觉语料有些不足和过时。目前Internet提供了很好的语料来源。我计划自己做一次搜集和统计, 选材面和数量将更加庞大和有原则。主要是词频统计。其次还有构词能力、语言变迁、多音、多义、同音、同义,等等。同时兼顾多个领域:包括口语、日常生活用语、自然科学、社会科学、热门前沿等等。还希望大家补充意见和提供语料。2)根据这些统计数据确定高频集,包括数量和内容:主要依据是:词频、构词力、虚词照顾、基本词照顾。 a)词频优先是毫无疑问的,是实用的原则。做好高频集1000词可以覆盖90%的实用率。但高频涉及领域之分和时期之分,还有发展趋向分析,合理预留分析等。这方面我会兼顾到。b)其次说说构词力。这个是因为这些单字很活跃,经常可以看作词根或者词缀,如“-子”、“电-”等等,而且新词还可以依此类推地不断涌现,所以必须特别研究它,并优先收入高频集。c)所谓基本词照顾,就是像LiYuan说的“锅碗瓢盆”,或者可以称作原始基本词、本源词汇。这些人类诞生以来最原始的生活元素或自然元素,哪怕现在词频很低,也会给予照顾,否则就有缺陷和遗憾。既要重视实用和发展,又要兼顾历史和文化。d)而虚词的照顾,是基于语言特点和语法方面的考量。常用的虚词不太多,但集中、出现率高,不像实词那样庞大数量、变数大。所以需要特别对待和定型。在句子构成中虚词和实词的作用还是有所不同的,实词往往负载更高的信息量,虚词一般情况信息量不大,属于补充信息,所以要优先定型和精简。如陈述句“我的书丢了”说成“我书丢”勉强表达出来原义,说明虚词信息量不大。又如疑问句“你吃了吗?”的“你”和“吃”就是主要成分,但是你要是只说“你吃”那么就变成另外的意义了。加上“了”表示完成的时态,“吗”表示询问的语气,这样就完整了。说明虚词有时还是很重要。3)定型高频词:这步是最关键的一步,也很具体,必须基于很多的统计资料,并且经过反复调整和统计分析。这部分我的设计原则是“怎么舒服怎么设计,力求外形完美,兼顾规则统一。”4)确定基本集的文字构造规则,包括词语构造规则。这部分基本上就是规则的问题,没有多少记忆的负担。我的义符设计也是在这个阶段发挥主要作用。这部分量较大,基本集大概就是相当于班门斧先生倡议的“当用汉字集”,可伸缩空间很大,语言发展也会引起这部分的词频激烈动荡,甚至构词力的极大变化。这部分我的设计原则是:基本没有“个体原则”,只有“全体原则”,力求原则简单规范,易学易记,科学合理。作为可行的拼音文字实践,基本集也可以分为两次发布,即常用字和次常用字。我大体上安排是:高频集(基础集): &1000字 (覆盖90%)基本集1: &2000字& (累计98%)基本集2: &2000字& (累计&99%)以上数据只是约数,需要等统计做完再来决定。以上几个阶段虽有优先次序之分,但互相关联,需统筹考虑。很多年前我都有初步做了一些,但是细化部分始终需要很多统计数据支持,这个就是下一步我必须继续的工作。但毫无疑问的是,我的总体思路十分的肯定和清晰。问题只剩下时间和动力了~~你们的支持,会使我增加动力。明年我准备暂停公司的一些事务,做一些更加适合我的研究性工作,包括拼音文字研究和计算机领域的一些研究。如果大家能够共同努力,中国文字是大有希望的。认真的研究和探讨,可以减少很多不必要的精力和资源的浪费。#xie ======谢谢,看了你的总表。以下谈点看法,仅供参考。1)你对异拼的分配是遵循了一定的规则,但是从具体某个字出发不容易反推出该字该用哪一个异拼。2)我希望的基本集里面,音素的异拼是规则的,也就是说同一个形状的字母组合发同一个音。这个我大体查看了你的总表,基本还是符合的,一时还没找出明显反例。不知你是否遵循这样的原则?3)我希望尽量减少一母之差的定型。也就是说两个汉字之差一个字母,这样的比例不能太高。可以统计一下英文或其他文字看看,作为参考。因为这势必造成识读上的困难,也会引起更多的拼写差错。4)我的方案对高频集网开一面,可以自由发挥,但实际也并不是无规则的,多数和基本集的规则还是一致的。只是这部分主要强调的是外观美感、个性特征。这也算是我的方案的重要特征。======只是说虚词优先,首批不是只是发布虚词~--------------------------------------------------------------------------------单纯先拼音化虚词数量是偏少。 我提起虚词意思是同等情况虚词优先考虑。 它只是我所谓的高频集的一个部分。 如你例子里面的“是”“一个”“人”“起来”“受到”就是属于首批的范畴。一般来说代词也是优先考虑的,如“我们”“这里”“哪里”等。 此外你例子并没有使用异拼,而我的方案里高频集的最强调的就是和汉语拼音的差异化,这样有利于外形辨识,因为汉语拼音外形太普通难以形成特殊的印象了。 因为汉字学习起来非常困难,所以必须改革。 yinwee 汉字 xoxil qivlay feecham 困难,soyy beexuu改革。 yinwee hanzir xoxil qivlay feecham kurnan,soyy beexuu gaige。 教育 是 一个 国家 de 根本。 教育 sh ige 国家 de 根本。 Joyuu sh ige GoJia de genben. 具体高频集的挑选原则,见前一次我给你的回复。 关于高频集、基本集的称谓,或者有更好的提法: 1)基础集、常用1集、常用2集。合称基本集。 2)核心集、扩展1集、扩展2集。合称基本集。 3)基本集、常用集、扩展集。 看看哪个称谓更加合理,大家不妨提提意见。 大致覆盖情况: 核心集 1000词,覆盖90%。 常用集 1000字,覆盖98%。(上一次写2000偏多了些) 扩展集 2000字,覆盖99.5%。 本贴由值班版主freeman于日 14:36:35修改过本贴由Freeman于日14:19:53在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======混合书写本来就是过度阶段的一个很有效措施--------------------------------------------------------------------------------我多次强调,为了平稳过渡,可以分批执行新文字的应用。 但一般是虚词优先拼音化,因为实词信息量大,可以帮助我们很容易就读懂全文的意思,由此带动这些虚词的识认和掌握。 虚词也很重要,好比骨架,整个句子需要它的支撑。 然后第二批逐步增加实词的含量,这样就十分自然过渡。 首批发布高频字词,数量不要多。 我也多次提到界定高频集选择的原则。 本贴由值班版主freeman于日 18:30:12修改过本贴由Freeman于日18:22:23在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======按我的理解你就是想问问那些高频的音节如何解决。可是你和某诗的格式挂钩又有何用?此外你不说具体的汉字,只列出一堆不带调的音节,也不说要别人做什么(整篇没有提到要做什么)。这就让人难以去理解和响应了。如果你要问那些高频音节的解决,最好编好一个句子或者一段文字,这样就非常好了。你最好看一下“施氏石狮史”,就有感受了。比如最高频的yi4音节,我举例如下:义 iea 意 yea 议 iee艺 yir易 eay益 eey意见 yeajen 异 eyy亿 yeea 意思yeas忆 yeeq译 ieei 抑 yeep翼 yeay 毅 yeer 亦 eiee疫 yeex役 eeay(因为我的方案没有定稿,这些仅供参考)======不会有太大记忆负担,因为高频集少于1千个词--------------------------------------------------------------------------------首批发布高频集(核心集),等大家习惯了以后再发布常用集,最后发布扩展集。核心集是包含较多的无规则定型,但总体还是有规律的所谓无规则就是更多的照顾外形,更多的使用特殊异拼,更多的采取省略方式,更多地省缺标调和义符。而且是以词为基础。普通集(常用集+扩展集),是按照一定的规则构造的,基本上很少特例,而且是以字为基础。至于词语连写,也是有规则地进行,并且是很宽松的规则。普通集将有更长一点的外形和更规则的外形。由于他们频度不高,所以注重的是规则,更少一些个性化,以便减少记忆量。大致覆盖情况: 核心集 &1000词,覆盖90%。 (注意是词)常用集 &1000字,覆盖98%。(上一次写2000偏多了些) 扩展集 &2000字,覆盖99.5%。 罕用字暂不拼音化,发展中需要增加的新字或词,让它自然演变,然后由国家定期规范发布。本贴由freeman于日00:21:46在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======是的,你的建议是对的--------------------------------------------------------------------------------我也是按照这样的原则,同样的一个韵母外形,代表的音调不会随声母不同而变化。比如:ee目前代表母音i4, ae目前代表ai4,oe目前代表ou4,那么我会一直当作第四声处理,除非高频集某个字有某种特殊的理由。但是同一个外形韵母在与不同声母搭配是,有可能发音产生变化。比如:yae 却代表yao4 而不是yai4(当然我也考虑是否就让它全部代表ao4)===Freeman Tse本贴由freeman于日01:01:45在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表.&======记忆量是经过充分考虑的,合理和科学的,具体回复如下--------------------------------------------------------------------------------【这样的“罗马汉字”可能有规律或者规则,但是肯定难记。】试想一下记忆1千个这样的文字容易还是1万个英文单词容易?而且记下了这1千词就可以读报了呀,英语行吗?况且,正如你所说,这些实际也不是随意分配的,是有一定的道理在理面。当然我已经说了高频集就是要强调外观,引入个性特征,由此也会引起需要记忆的东西,但是由于外观是“精雕细琢”而来,记忆它就会变成一种享受,不会是一种痛苦。因为高频集的特色就是随意发挥,如果是设计合理科学,那么其实就好比在欣赏艺术品一样,乐在其中。随意发挥不是随意堆砌字母,那样确实难记,却易忘,有了足够的内涵的美丽外观,那么不会难记,而且难忘。比如eay(易)也许可以联想成英文easy啊,yeap(抑)里面的p既有入声的意思又有“手”的义符含义,不会难记。yeaq的q是代表心,所以就是“忆”。包含“言”字旁的一般有“i”的义符或兼音符。同时ee、ea都是i4音节的异拼,保证读音不会有难处。当然这些只是例子,毕竟不是定案,等我完善差不多了,我会再次和大家讨论。我自己发现,有一些单词已经不知不觉里被我记牢了,但我现在根本就不应该去记忆它呀,因为还没有没有最后定型,这样会影响最后定型的科学性。最后的定型必须的基于大量的统计数据,这也是我多次提到的,所以我尽量不想仓促给出之前的草案也是这个缘故。义部的规划因为涉及到的东西和我之前的“新全息码”考察的目标完全不同,所以不能照搬使用。最终的定型需要以下几方面共同完成:1)我自己初定的草案和规则。2)统计结果的多次反复修正。3)专家的意见。4)大众的意见。【声音(附加声调?义符?):】是的,音调信息本身已经在拼式里面了,当然高频集里有部分是省缺了标调。义符最终也是会有一定的使用规则的,而且需要做到不干扰表音,同时对字型识认又有一定的帮助。【形式单调,容易混淆。意义模糊。】当你不熟悉它的时候,是会有这样的印象,这也很正常。之前我说过我是尽可能消除字型接近引起的混淆,但正如吴耐先生指出的,完全消除一母之差的外形是不现实的,是需要以冗长的外形为代价的。外形简短与高辨识信息这是一对矛盾。这个在我那篇“汉语特点与拼音文字”已经阐述了。为了合理解决这样的矛盾,我采取的措施是:1)高频集任意发挥,这样只要认为会混淆的单词都可以设法避免。特别是很多本来很漂亮的单字,结果在构词以后变得不漂亮甚至不清楚,这也是我下一步一个重要课题,就是构词能力的统计和构词考察。2)大量增加异拼的使用,使得外形区别度大大加强。3)普通集大量使用义符辅助外形。虽然不是所有的字都使用,但对于普通集的扩展集部分,形声字一般都会使用。况且这里列举的yi4是比较高频的音节,如此密集的音节,字型相近是必然的,靠加长长度来区分也是不合理的,这些我有考虑过。其实英语中同样存在大量的”一母之差”的文字,只是人们已经把它记牢了,加上特定上下文的牵制,所以仍然不容易造成识认困难。其次因为词频统计我需要重做,这里列举的例子不是很准确,列表涵盖已经超过了高频集,而那部分最终是会更加规则化的,不需要太多的记忆的。【字本位?词本位?】请给出“字本位”和“词本位”的严格定义,否则我很难说我是字本位还是词本位。其实我的思想最近一段已经重复提了不少了。或者应该这么说吧:我的方案是以字为基础,以词为最小文字单位的方案(因为字也是一种词)。可以说是词本位,但是我不是要给成千上万的词造一个单词,而是以字为基础构造出成千上万的词。也许你会说那就是字本位。可是很显然,首先看看我的高频集,它是以词为单位的,有很多词就像英文的“单词”一样是独立的语法单位,不要试图再把它拆解成“单字”了。其次普通集里面的“紧粘词”也将渐渐演变为独立运用的定型词,未来的某个时候说不定自动被简化、变形形成和高频词里面一样的“单词”,这就是拼音文字的特点。不管怎么说“字”是基础,因为几乎所有的汉字都可以成为“单字词”,不解决这样的问题,就无法继承中华文化、继承历史。【必须死记硬背。】前面说了,死记的只是少数不是全部,比起“汉字”的死记,简直不值一提。【离不开汉字拐棍儿。】为何离不开?两种文字可以互相替代的。可以自动转换的。还可以互相混用的。这些充分说明它是完备的,自成系统的。如果你要说罕用字这一块,目前建议是保留方块字形式,但其实这不是问题:1)这些实用频率非常低,对现代的文化几乎没有太大影响。2)如果认为有必要,增发一下罕用字的拼音文字规则,不过是把我那些义符加上去而已,这样所有的方块字都能解决。当然这部分只是给专家学者使用,平民百姓可以不理。【国家官员和平民百姓赞成这个方案者请举手!】希望大家多提宝贵意见,同时也可以说说哪些方面不可行,或者不如其他的方案,以便我能够进一步阐释或改进。===循序渐进的推广步骤===1)首批发布高频集(核心集)。2)等大家认识了和习惯了以后,再发布常用集。3)最后发布扩展集,至此可以完全脱离方块字独立运转。大致覆盖情况: 核心集 &1000词,覆盖90%。 (注意是词)常用集 &1000字,覆盖98%。 (少量记忆)扩展集 &2000字,覆盖99.5%。(几乎不用记)核心集是包含较多的无规则定型,但总体还是有规律的。所谓无规则就是更多的照顾外形,更多的使用特殊异拼,更多的采取省略方式,更多地省缺标调和义符。而且是以词为基础。普通集(常用集+扩展集),是按照一定的规则构造的,基本上很少特例,而且是以字为基础。至于词语连写,也是有规则地进行,并且是很宽松的规则。普通集将有更长一点的外形和更规则的外形。由于他们频度不高,所以注重的是规则,更少一些个性化,以便减少记忆量。罕用字暂不拼音化,发展中需要增加的新字或词,让它自然演变,然后由国家定期规范发布。===Freeman Tse本贴由freeman于日18:37:30在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表.&======谢谢你的关注。也欣赏你的工作和心态。--------------------------------------------------------------------------------致吴耐先生:谢谢你的关注。也欣赏你的工作和心态。其实我的热情倒是有的,但为了目前的工作,必须抑制它:)大概在这两三个月内,我不大有时间专注于此。然后我会做一个较大规模的词频统计。统计结果将第一时间在这里公布。再之后,酌情整理和公布我的“新全息部首码”和拼音文字初步方案。总体而论,我感觉拼音文字要达到方块字那样的高辨识信息是很难的,毕竟方块字包括了大量的非表音信息。同时由于人们习惯的原因,如果没有合适的机缘或者政府的促进,要普及也是蛮困难的。不过我还是充满希望,一方面是来自于兴趣,一方面是拼音文字毕竟有它的积极意义存在的。===Freeman Tse本贴由freeman于日18:19:50在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表. ======
平凡的水果世界,平凡中的不平凡。 今朝看水果是水果 ,看水果还是水果 ,看水果已不是水果。这境界,谁人可比?在不平凡的水果世界里,仁者见仁,智者见智。
正月是农历新年的开始,人们往往将它看作是新的一年年运好坏的兆示期。所以,过年的时候“禁忌”特别多。当然,各个地方的风俗习惯不一样,过年的禁忌也是不一样的。
庞凤山情感处方
请注意使用文明用语
画报点击数0
文章点击数0

我要回帖

更多关于 dou是什么意思 的文章

 

随机推荐