语言文字资料汇编

[以下截图与引文皆源网络,侵删]


  不同语言间的相互影响是不均衡的|新浪网

  大众传播语言的力量|百度文库

  《语言学纲要•第七章•文字》PPT,117页|百度文库


写在前面

  先来看看下面这段引文吧~

摘自豆瓣作者 狸猫 的一篇文章

  …… 然而因为英格兰内部南腔北调,长期以来政府也不重视,导致各地的拼法极为混乱。比如表示进行时态的屈折形式ing,当时的北方是加and,所以running在南部是running,在北部就拼成runnand,而到了英格兰中东部则是runnend,中西部则是runnind。
  再由于南北方曾受到不同语言和文化的影响,很多日常用词也有巨大差异,比如church,北方叫kirk。但如果只是church和kirk的区别,确定正字还好办,大不了只选一个;然而即使同一个单词同样的发音,不同地区拼法还不同。church可以写成churche,chirche,cherch,chyrch,cherge,chyrche,schyrche,cherche等等,kirk则有kirke,kyrke,kerke,kyrk,kerke等等。英语拼写内部分裂的局面极为糟糕。

  汉语也有很多方言,发音也不尽相同。汉字拼音化後,拼写法将五花八门,比之上文也强不到哪儿去。试问,数百年後的国人如何认得这五花八门的拼写文字?还传承文明,毁灭文明还差不多!

  都知道历史文化与理论技术赖文字以传承,文字系统一旦混乱,传承进程必然渐趋瓦解崩坏。

一句话,当年的英文正字法就是愚蠢的代名词,而现代英文的拼写规范则是愚蠢的产物。

  那么汉语呢?以後一旦字词发音大规模变化,拼音书写系统岂不得崩溃?人家土生土长的英文 尚且曾有如此多的荒诞和不堪,你一个拼音化的替代文字,其表现难道会比英文更优秀?

  如果仓颉或古人造字,也只看眼前,那就都用拼音符号好了嘛。各地方言各拼各的,凑合着能用就行了。结果便是区区百年之後,便完全看不懂前人记述了。


  汉语高度依赖音调 来区分为数众多的同音字,古音更是如此。

  古有入声,还细分尖音团音,赖此等发音之别,听者方才可「乍闻而知其意」。文言语义凝缩,听者虽偶有误解之时,也不至于大惑不解。

  然若换作纯拼音记录,即便注明声调,但因汉语同音同调的音节太多,光看这大段书写的纯拼音,仍无法迅捷、准确地领会文意〖即便熟练掌握,仍易误认 误读 误判 误解〗。故不便信息交流,也不便文化传承。

  先人察此原委,乃造文创字,使一音(节)恒对应一字。此虽初学时习字繁难,然一旦入门,循规律掌握下二三千常用字,其後之进阶 便可谓丘陵变坦途。

先甭说各种非学术的进阶词汇,单是生物学、医学、数理化、工程学、计算机等领域 所涉及的大纲词汇,就足以把“非英语母语人士”逼疯!

  欧美文字,非一蹴而成今之样貌,乃翩延若干世纪,字母之音与形 亦历数次大更替。若按书面之字母系统言:① 原始西奈山半岛字母[proto-Sinaitic]演变成腓[féi]尼基字母;② 腓尼基字母 演变为古希腊字母;③ 古希腊字母 演变为古拉丁字母。

[註]:

  一说腓尼基字母在形成过程中 参考了古埃及象形文字以及美索不达米亚的楔形文字。

  由于创制腓尼基字母的腓尼基人[其自称“迦南人”,隶属“西部闪米特人”的西北分支]擅长并热衷于航海和经商,在古典商务活动中 人们也倾向于简化文字书写符号,以提高效率;因此,闪米特人收集汇总了 当时其他地域或国度的字母系统,取各家之长而精简之,遂成大器…… 呃不,遂成腓尼基字母。

拉丁字母流变过程 简示图

自上而下分别为:原始西奈字母➟腓尼基字母➟古希腊字母➟古拉丁字母➟古罗马字母➟现代拉丁字母

对上图中「BCE」和「CE」的注释



由上知,各种字母系统其演变历程十分曲折,上述仅是高度简化後的流变梗概。既然纯表音字符有如此众多的{历史&现代}形态,我们即使引入字母文字来记录语言,也不应仅仅局限于英文字母系统。且在历史进程中,各国吸取外来的字母文字系统时,往往都会因地制宜地加以改造增删,使之与本国、本民族语言的发音特点更加契合。

另一方面,我们来看看汉字。

汉字中,形声字的占比高达80%~90%。而形声字的特色 —— 声旁,是所应关注的重点和难点。一个个声旁,若笼统而模糊地来看,就是一个个表音符号,只是写法迥异于字母文字罢了。

字母文字,多数情况需要几个字母才能拼成一个音节。且由于欧洲诸文字在发展历程中 出现了较严重的「音形脱节现象」,即「书面拼写形式 滞後于 口头发音的发展变化」。比如英文单词中令人头疼的「音节拼写不规范现象」,多半就是古英语向现代英语的发展进程中,某些单词的发音变了,而约定俗成的单词拼写法却没变。

「sight、light、night、right、taught」中的「gh」不发音,却仍得写出来,渐渐竟成了一种“装饰”。还有N多单词的拼读方法并无规律可循,这都是其(书写系统的)硬伤所在【大幅增加了非母语者 认读和记忆单词的时间与精力成本。且英文单词浩如烟海、意项繁杂,又为进阶学习者制造出诸多障碍.】。一旦汉字拼音化/拉丁化/字母单词化,其中硬伤更是难以估量。

  当然最有名的就是萧伯纳那个“ghoti”一词的传闻。他老人家说这词念/fiʃ/[音同单词fish],因为gh在“enough”里念/f/,o在women里念/i/,ti在motion里念/ʃ/。当然这是一个调侃的笑话,但确实也说明了即使是本国人也都吐槽英语读音和拼写不一致。

  英语最大的笑话:正字法|豆瓣

  汉字字库如按“使用频率之高低”进行排序,则使用频率越高的字库,其范围内非形声字的比例越大;逐渐扩大此字库规模,其范围内的非形声字占比会越来越小,同时形声字的占比会越来越大。
  通用七八千字范围内,形声字占比大概在85%左右;《康熙字典》或《汉语大字典》里的形声字占比,估计可达95%[未实际统计]。
  ——— 摘自“知乎”。原文表述过于随意,已对其文句结构进行修订。

  各国语言都是历史进程中 各国人民因地制宜创制、改良出来的产物,具备鲜明的地域特色、文化特色和语言特色。故其相互之间并无高下优劣之分,英文在汉文面前,也没多少优越感可言。

  只不过近代以来,欧美主导着各领域的进步,占据着诸多领域的制高点,睥睨众生、傲世寰宇的凛然霸气由此生焉。由于清末以来,国家与民族险些消亡于欧美列强之手,致使各阶层民众普遍失去了文化自信、民族自信,进而才大开脑洞般地 提出一些过激的、不恰当的倡导和主张来。

  语言总先出现,而文字循其章法、继其後尘。故语言与文字相辅相成,天生一对;一旦拆散、改配其他,就是乱点鸳鸯谱、破坏金世良缘,其“婚後生活”也自难幸福。


  再来看看日韩文字,其古代就完成了拼音化,可他们那是不得已而为之。毕竟繁体汉字太难写了,日本最初引进汉字,就是为设法将之改造成 与日本语言相配套的文字书写系统。

  後来,日本宫中女官在进行业余文学创作时,畏汉字书写之繁难,据草书汉字 研创出平假名;後来男性官吏 又据楷书汉字研创出片假名。两种假名的性质 类似于「汉语拼音音节」,日语中的各种音节 方才得以通过「假名」这种较为简洁的书写形式 记录下来。


平片假名字源简表

平假名字源


片假名字源


  直到近代统一假名之前,假名仍存多种书写体系;因其并非一时、一地、一人之作,故写法各异。

  假名是一种标音符号,标示日语中的各种音节,故其写法不重要,约定俗成、一一对应的指代方式才重要。

  百度知道:假名的起源

  至于韩文,大抵也是为简化百姓识字之艰辛,乃造谚文而辅之。谚文广泛推行後,民渐安简易而恶繁难,故汉字渐废,谚文取而代之。汉字与谚文皆是为了标示韩语[或朝鲜语]之发音,韩语发音迥异与汉语,故大可摒弃繁难之汉字,改换相对简易之拼音文字 —— 谚文。

  公元3世纪左右,汉字传入朝鲜半岛,后来又采用汉字的音和意来记录朝鲜语,即「吏读文」。但由于封建社会等级观念的影响,能够学习和使用汉字的多是贵族阶层,普通民众则很难接触到。而且结合汉字创制的「吏读文」有些也不适合朝鲜语的语音系统和语法结构,因而有时很难准确地标记朝鲜语言。因此,当时的人们 非常希望能有一种 既适合朝鲜语语音系统和语法结构、又容易学会的文字。[百度百科]

  而汉字就是诸多汉语语汇 约定俗成的指代符号;且汉字跟汉语中的语素、语汇高度对应,这种对应习惯已绵延两三千年之久。

此图中说,「用恰当的形体来记录语言中的音」,而汉字在某种程度看,正是这种「恰当的形体」。其能一音对多形,大规模分流了同音字,消减了歧义。

上面图之註文还要补充一句:欧洲语言,音节的“蹦哒”频率较高。而现代汉语由于有大量双音节、多音节词汇,故音节速率与表达效率较之古代,肯定有所变化。

双音节与多音节词汇,部份有一定的语义重复倾向,进而产生潜在语赘;有些则是应时代发展需要,不得不构造出来的多字或多音节词汇。

  下图可见,(现代)国语/汉语的音节速率较低,但跟英语也相差不大。事实上,(里昂大学的)该研究客观性较低。首先,其样本基数不算大;其次,受试者诵读的材料趋于单一,故数据的弹性张力也较低。

  试想,在某些美国IT精英接受采访时,语速很快,但是清晰,信息密度也骤增。同样的语速,汉语几乎望尘莫及。这就是语速在非极端情况下的弹性张力。

  我想这应该得益于英语卓越的可连读性质。汉字都是以韵母[或称元音]结尾,很难跟下个字形成连读。英文中的连读,大都发生在辅音结尾和元音开头的地方;另,辅音结尾+辅音开头,结尾的辅音常会自然弱化,进而快速引出下个音节,从而形成富有弹性的语音流。

由于英语这样的语言 音节繁多,其自然呈现的卓越的连读机制,便可谓是以长补短,使其语速提升,表达效率亦提升。

而日语却同汉语类似,音节多是辅音起始、元音结尾,从而难以连读;另一方面,在表达相同意思时,日语所需的音节数明显多于汉语。不能连读,音节还多,所以才致使其「音节速率」高,而「信息速率 与 信息密度」低。

若看不懂此图 请看下面那篇豆瓣文

  豆瓣:哪种语言的语速最快?

  360doc:时代周刊:何为有些语言的语速那么快?

  360doc:为何汉语的思维速度比其他语言快?

  360doc:英汉同声传译的语速语义匹配 及语言逻辑习惯

  360doc:英语和汉语谁更高效?17大主流语言测试结果:带宽都是每秒39bit

  100年前,全世界都认为汉语是婴儿语|CSDN博客[此为另一篇文的完整版]

  美国知乎[Quora]问答 中英对照:汉语做出了哪些牺牲,才成为一种紧凑、高效的语言?

  是的,不该看历史,该看其合理程度。而恰恰是在合理程度方面,汉字之于汉语,有「高准度、高适应性、高灵活性、高规范性、高便捷性、易认 易读 易记」等特点。汉字虽不易写,但简体字较繁体字已然简易太多。

 ※ 强调“表音准确度”与“语义精准度”的「易认 易读 易记」才是真正的「易认 易读 易记」。

  而「英/法/德/意/西/葡/俄文(语)」就蒸的易学易写么?…… 英文多变的拼写,法文繁杂的语法,德文冗长的单词,意语超难的大舌音,西语、俄语高难的小舌音,葡语……  (๑• . •๑) 

  知乎:欧陆国家的诸语言相似度到底有多高?


  据猜测,近现代汉字拼音化的倡议,是因汉语中文 已经完成了去文言化和口语化的工作。表达同样的意思,所需的音节与汉字渐渐变多。

  当时举国危殆,亟待救国救民。又根据欧洲史,中世纪後的长足发展 源自文艺复兴、宗教改革和启蒙运动。反思中国,则首须推翻封建帝制,确立人本主义思潮,然後大力发展和普及艺术与科技事业。而艺术与学术想要繁荣,必须夯实教育来作後盾。而教育之始,在识字,中国字较之字母文字又太过繁难。因此,开始主张改革文字。

  可由于汉语词汇中,同音同调的音节太多,根本没法儿用字母来标示,否则通篇文字将使人困惑难解。仅为了方便识字和书写,致使功能性与效率俱失。此可谓舍本逐末。

  但,设身处地当时景来想一想:环伺皆为身处水火之中的疾苦黎民,他们不念大学,不搞学术,也无需进行精确书面记录,仅需记录一些日常账目、生活琐事、学习心得而已。此时,若能掌握一套易学易记的拼音符号系统,来直观、便捷地记录下口中所言、心中所想,自是再好不过。

  ——— 由此见,「汉字拼音化」之初衷,大抵应是拯黎民于水火的一项权宜之计。所谓「制备简、见效快」,一旦问世,庶民皆奔走习学之,届时街巷百姓皆能写,四海民众都认字。如此愿景,不可不谓宏丽!

  然则时代过矣,今之民众识字率,较之当时,早已不可同日而语。今之基础教育普及率,已近乎全覆盖。学生再不患不能识字,而改患课业高压。

  再者,字母文字可连写,良多弯弯绕;汉字亦可连写,谓之行书。行书既会,书写之劳累骤减。彼时汉字纵有三四十笔划,也能曲折回转,一气呵成。横竖撇捺间,方直顿显;波折回旋处,气韵骤生。于是,气与势合,神与韵并,纵横方寸间,目悦心恬。


  正所谓太极不战①,退以调心;汉字不简②,缀③以涤魂。

不擅长也不着意于搏击对抗。

并不简易,也不宜过份简化。

连缀,串连。词句缀连,乃成篇章。


  汉字与书法并驾,诸体共时代齐驱。

  非精书,无以识块垒※奥义,不撰文,无以察汉字精微。

  是故,诗词骈散,以彰厚味;章草篆隶,以展奇瑰。

 ※ 块垒/塊壘,本指郁结心中之愁怨,此借以指代方块字。块垒,谓垒积之石块也。心中郁积之事物、情感,恰似石块垒叠其间,故谓「胸中块垒」。
  而汉字其形,近方而成块,逐个缀连,乃成语句,行列累加,方作篇章。成块而垒叠之,故汉字或可以「块垒」状之也。
  又,上句中之「块垒」如换成「笔划」,句意亦通。

  不明白 那些稍微想想便觉不可行的「拼音化汉字」,为何仍不乏拥护与倡导者?… 遂草撰此文,以抒胸臆。


   [完]


文之既成,配图难插。悉数置于後,以供统阅: 

语言学考古附图

  文言:汝何意?
  白话:你什么意思啊?
  日语:どういう意味ですか?
  经过某民族魂改革以后,汉语不再是信息密度最高的语言了。目前信息密度最高的语言 是越南语,曾脱胎于古汉语。

  计算机语言的信息密度 - FerventDesert - 博客园


语言学附图

历史地来看,某一地域的文化繁荣 高度依赖于该地域的经济繁荣。经济着实是诸多事物的基础。

  承上,经济着实是诸多事物的基础。联系到国内之舆论管控,旨在维稳,其深层用心,可谓深远而良苦。

  盖舆论若动荡,则民心惶乱,易引尖锐冲突,形成派别对立;而继续宽松的舆论环境,还将推波助澜,持续扩大和发酵争端。内讧则外侮至,内斗则虎狼来。届时,帝国主义扇阴风点鬼火,外加趁火打劫,国家与民族必危。

  而限制较多的舆论环境,有利于社会言论收敛,有利于消减对抗和争端,有利于地区的长期稳定。惟持续稳定,方能休养生息,历朝历代皆如此。昔文景安国而民富,武帝好战而邦颓。… 忘战必危,故强冰维稳;好战必亡,遂济世援非。

  《传》曰:志士之爱国,必为之计深远;仁人之爱民,必使之少争端。 其此之谓乎?| 

   (๑• _ •๑)

某一地域、邦国之经济愈发达,世人则愈倾慕、向往之;爱屋及乌,遂也更乐于学习其语言文字。


假名附图

平假名字源 及古音注释 ①

平假名字源 及古音注释 ②

  不要再问我“日语好学吗”(中)

  日语中为何既有平假名又有片假名?|知乎


   [終]

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,056评论 5 474
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,842评论 2 378
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 148,938评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,296评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,292评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,413评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,824评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,493评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,686评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,502评论 2 318
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,553评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,281评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,820评论 3 305
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,873评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,109评论 1 258
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,699评论 2 348
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,257评论 2 341