惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

GbyAI
GbyAI
T
Tenable Blog
Webroot Blog
Webroot Blog
L
Lohrmann on Cybersecurity
S
Securelist
S
Schneier on Security
NISL@THU
NISL@THU
Know Your Adversary
Know Your Adversary
C
Cybersecurity and Infrastructure Security Agency CISA
T
The Exploit Database - CXSecurity.com
L
LINUX DO - 热门话题
C
CXSECURITY Database RSS Feed - CXSecurity.com
O
OpenAI News
I
Intezer
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
TaoSecurity Blog
TaoSecurity Blog
S
Secure Thoughts
Application and Cybersecurity Blog
Application and Cybersecurity Blog
P
Privacy International News Feed
H
Hacker News: Front Page
N
Netflix TechBlog - Medium
M
MIT News - Artificial intelligence
博客园 - Franky
PCI Perspectives
PCI Perspectives
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Microsoft Azure Blog
Microsoft Azure Blog
MongoDB | Blog
MongoDB | Blog
L
LangChain Blog
P
Proofpoint News Feed
S
Security Affairs
WordPress大学
WordPress大学
The Last Watchdog
The Last Watchdog
S
SegmentFault 最新的问题
小众软件
小众软件
F
Full Disclosure
博客园 - 叶小钗
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
T
The Blog of Author Tim Ferriss
Simon Willison's Weblog
Simon Willison's Weblog
P
Palo Alto Networks Blog
Security Latest
Security Latest
P
Proofpoint News Feed
月光博客
月光博客
T
Tailwind CSS Blog
Scott Helme
Scott Helme
Hacker News - Newest:
Hacker News - Newest: "LLM"
Google Online Security Blog
Google Online Security Blog
T
Threat Research - Cisco Blogs
Help Net Security
Help Net Security
Project Zero
Project Zero

Dvel's Blog

Rime 全拼双拼混输 CHD 油猴脚本:每日签到自动答题 Rime 配置:雾凇拼音 Hammerspoon 自动切换输入法 修复 Hugo 本地图片的累计布局偏移(CLS)问题 macOS 利用 Karabiner 修改 Emacs 键位为 Vim 键位 macOS 修改 Emacs 键位为 Vim 键位 Surge 配置 Netflix 中英双语字幕的好办法 优化 Rime 英文输入体验 判断字符是否为简体字或繁体字 Cloudflare 转入域名提示「出现了问题。请重试转移此域。尚未向您收费。」 图片压缩:Squoosh、TinyPNG、ImageOptim、WebP macOS grep + sed 批量替换多个文件的内容 在 macOS 根目录创建文件夹 博客图床小妙招 折腾 Hugo & PaperMod 主题 利用 Cloudflare Workers 进行批量 301 重定向 将博客部署在 Cloudflare Pages Alfred File Navigation(文件导航器)详解 在 Hugo Goldmark Markdown 中设置以新标签打开链接 日期与时间(UTC、GMT、时间戳、时区) 让 Alfred 以新标签的方式打开 Finder 用 git filter-branch 给 Git 仓库瘦身 qBittorrent 设置教程 联通光猫破解+桥接记录 配置 Mac 终端走代理 Steam for Mac 中文游戏推荐 我的 Mac 软件/工具列表 《Flask Web 开发》笔记 用 sleepwatcher 让 Mac 在睡眠及唤醒时自动执行一些脚本 解决 pyenv 导致的 brew warning 《SQL 必知必会》笔记 Git 自总结 Python 异步 IO 笔记 再见,双点医院! 用 CloudXNS 解决 CNAME 与 MX 记录冲突 你好,Hugo! 为 Mac 打造 zsh command line 环境 新 Mac 新装修 秦皇岛暑期自驾的烦恼 苹果公司开发者账号申请流程 UIScrollView 中使用 Masonry 解决 CocoaPods 的类库 import 没有提示 iOS 使用 CocoaPods 的快速回顾 GitBook 简单生成本地静态 HTML 的方法 你好, Hexo! About
汉字的混乱
Dvel · 2022-08-01 · via Dvel's Blog

在为自己的 Rime 词库 进行修订时,发现了很多以前不曾了解的汉字规范。

从修订记录里翻出了一些,算是自己的吐槽吧。。。

模棱两可

「滴里耷拉、滴里搭拉、滴哩答拉」→「嘀哩嗒啦」,「啰哩啰唆」→「啰里啰唆」,「劈哩叭啦」→「噼里叭啦」,「嘁哩喀喳」→ 「嘁里咔嚓」。。。

为什么上面这些除了「里」都是口字旁,却不用同样是口字旁的「哩」呢?

「暗淡」「黯淡」。

「呆会」「待会」,表「停留」时,《现汉》未作推荐但有一个「待dāi」的一声读音专门用于这个意思,《现规》推荐使用「呆」。

「标识zhi」「标志」,「标识zhi」一直是「标志」的异形词,但《现汉》6、7 开始有了「标识shi」,《现规》直接推荐使用「标志」。

「勾拳」「钩拳」,Hook 本就是钩子的意思,我站「钩拳」。

「抗不住、抗得住」「扛不住、扛得住」。

「嚎叫」「号叫」「嗥叫」。

「定亲」是「定」,「订婚」是「订」。

各种「词」与各种「辞」。

「贻 X」与「遗 X」。

「杆」与「竿」。

「得意洋洋/洋洋得意」「得意扬扬/扬扬得意」。

「发愤图强」「奋发图强」。

「鱼钩」「渔竿」「钓鱼竿」。

「嘁嘁嚓嚓」→「嘁嘁喳喳」,「嘁哩咔喳」→「嘁里咔嚓」,不同的地方用不同的 cha。。。

「下功夫」「费工夫」。

「悲催」「悲摧」。

「备受」「倍受」。

「比划」「比画」。

「西瓜子」「西瓜籽」。

「鄙人」「敝人」。

「闭塞」「蔽塞」。

「侧足」「厕足」。

「闺中密友」的「闺密」与「闺蜜」。

「激凸」「激突」。

「叫作」「叫做」。

「做出」「作出」,以及各种「做 X」和「作 X」。

「绝不」「决不」。

「谩骂」「漫骂」。

「避邪」「辟邪」。

「泄气」「懈气」。

「佚/轶/逸」+「名/事」。。。

「蒸气」「蒸汽 = 水蒸气」。

「属望」「瞩望」。

「启航」「起航」。

「乐呵」「乐呵呵」「乐乐和和」。

「当啷」与「郎当」。

「作何」「做何」。

「订做」「定做」。

「订制」「定制」。

「实验」「试验」。

「畜生」「牲畜」。

「无名火」「无明火」。

「去除」「祛除」「驱除」。

「碾压」「碾轧」

「阵势」「阵式」

过于细致的拆分

很多字词没有作为异形词,而是分别赋予了不同的意思,或运用在不同的语境下。

校对网还看到一个 校对疑难问题分享搜集

细致的 cha:「道路分岔」「树木分杈」「头发分叉」「河流分汊」,还有个「裤裆开衩」。😅

「群山曼延」「杂草蔓延」「洪水漫延」。

「声音/水势洪大」「规模宏大」。

「作客」「做客」。

「用作」「用做」。

「年青」「年轻」。

「莫名其妙」「莫明其妙」居然不是异形词,而分别代表不同的意思,有细微的差别。

「谐调」「协调」,「协调」包含「谐调」,但多一个「使配合得当」的意思。

「嘀嗒」「滴答」,「嘀嗒」和喇叭钟表等相关,「滴答」和雨滴相关。

「淤斑」「瘀斑」、「淤血、瘀血」,前者表血液凝滞,接近西医;后者一般用于中医。

「赢利」「盈利」「营利」。

各种 meng long,日光不明用「曚昽」,月光不明用「朦胧」,目光和其余的都是「蒙眬」。

「含意」「含义」,「含义」表字词句具体的意义;「含意」表言语行为事件含有的意思(隐含的深意或言外之意)。

「片段」「片断」,前者表完整段落,后者表零碎段落。

「纯朴」「淳朴」,意思基本一致。

「泄露」「泄漏」,一般来说是「泄露秘密」和「泄漏原油」,但《现汉》里「泄露」下面写了一个「同泄漏」,「泄漏」下面写一个「同泄露」,《现规》甚至还弄了一个「泄漏消息」的例句。

「蕴含」「蕴涵」,前者是常用的,后者多用于一些学术上的。

「查/察看」「检查/察」「考查/察」「审查/察」。

「腆着胸脯」「觍着脸」是不同的 tian。

「辨证」「辩证」。

「传授」「传受」。

「画外音」「话外音」。

「见谅」「鉴谅」。

「交代」「交待」。

「宽洪」「宽宏」。

「联合」「连合」,「连合」居然不是异形词。

「弥蒙」「迷蒙」。

「起程」「启程」,《现汉》几个版本折腾两遍后,又全都收录了。

「善于」「擅于」。

「蛊惑」「鼓惑」。

「受让」「授让」。

「萦绕」「潆绕」。

「执掌」「职掌」。

「受命」「授命」。

「农田龟jun裂」与「皮肤皲jun裂」。

「撅屁股」与「噘嘴」。

「报料」「爆料」。

「抚养」「扶养」。

「急须」「急需」「亟须」「亟需」。。。

「神志」「神智」。

「肤浅」「浮浅」。

词典的问题

「嘀里嘟噜」「滴里嘟噜」,《现规》说不宜写作「滴里嘟噜」,《现汉》则都收录了,并且表示的意思不一样。

「不惟」「不唯」,《现汉》收录的是「不惟」,但怎么想也应该是「唯」,「唯」才有「但、仅、只是」的意思。

《现汉》推荐「钩心斗角」,《现规》推荐「勾心斗角」。

「蓬门荜户」「蓬门筚户」《现汉》推荐「荜」,《现规》推荐「荜」,按字义来看,「荜」是植物,「筚」是用植物做的东西,应该用「筚」比较合适。

《现汉》推荐「比画」,《现规》推荐「比划」。

「鱼钩」「渔钩」,早期《现汉》《现规》都推荐「渔钩」,后来《现汉》推荐「鱼钩」;虽然《现规》的推荐是「鱼钩→渔钩」,但是它还推荐了「渔汛→鱼汛」,好乱。

「德行」「德性」,表骂人时,《现汉》推荐「德行」,《现规》推荐「德性」。

《现汉》推荐「蹚浑水」,《现规》推荐《趟浑水》,《现规》直接将「蹚」作为「趟」的异形词,而《现汉》对「趟(一声)」的解释是「旧同蹚」。

《现汉》将「高招儿、高着儿」「绝招儿、绝着儿」「妙招儿、妙着儿」按照是否下棋作为区分,但对「昏招儿、昏着儿」却按异形词进行处理。

《现汉》推荐了「瓷器」与「磁漆」,两个 ci 并不统一。

「繁琐」「烦琐」,现在《现汉》首选「烦琐」了,感觉「繁琐」用的更多。

《现汉》推荐「榴梿」,全国科学技术名词审定委员会推荐「榴莲」(目前使用较为广泛的)。

《现汉》对「旋涡」「漩涡」来回折腾,一会这个是异形词,一会那个是异形词。

《现汉》前几版及《现规》推荐「称钱」,《现汉》现在推荐「趁钱」。

《现汉》推荐「轧马路」,《现规》推荐「压马路」。

有很多字词,全国科学技术名词审定委员会、《现代汉语词典》、《现代汉语规范词典》都不同。

对于多音字,词典没有给出那些少数的特殊读音的全部用例,比如「棱leng」还有一个 ling 音,《现汉》和《现规》的解释中都只提到「穆棱ling」,其实还有一个「丹棱ling」。这让普通人就更难寻找到正确的读法,尤其是中文搜索本就比较艰难,百度百科也没有一丁点儿可信度。比如一大堆含有多音字「陂bei pi po」的地名,完全无从寻找,难道只能问当地人吗?

专业术语的用字选择

「桔子」是「橘子」的俗写,但「橘斑幅尺蛾」根本搜不到什么,只能用「桔斑幅尺蛾」,在很多食物中也使用了「桔」。

很多计算机的书籍、论文仍在用「标识符」,应该用「标志符」,《第一批异形词整理表》就将「标识zhi」替换为了「标志」,但《现汉》同时收录了「标识zhi」和「标识shi」。

到底是「安纽夜蛾」还是「安钮夜蛾」呢。

「桑葚」「桑椹」混用的情况极多。

历史包袱

「做戏」「逢场作戏」的「做/作」。

「褴褛」「筚路蓝缕」的「褴/蓝」与「褛/缕」。

「反照」「回光返照」的「反/返」,另外《现汉》推荐的是「反照」,《现规》推荐的是「返照」。

「屏除、屏弃、屏绝」「摒除、摒弃、摒绝」,「象/像」做了细致的区分,但「屏/摒」没有做。

「伶仃洋」「零丁洋里叹零丁」。

「丰都」「酆都鬼城」。

「二心」「忠贞不贰」。

「拾遗补阙」「补缺」。

「飞语」「流言蜚语」。

「句践」→「勾践」,但是「高句丽」仍然在用「句」。

词典和民众使用习惯都已经完成转换的词汇,比如「折衷」→「折中」,但是在一些专业领域仍保留原始的写法。例如「折中」与「折衷主义疗法」、「艾鲁岛折衷鹦鹉」,又例如「鲇鱼」与许多冷门生物名词「XX鲶」。

特殊的读音

极度坑爹的读音。

「杉shan树」的木头不叫「杉shan木」,叫「杉sha木」 (╯°Д°)╯︵ ┻━┻

「栅shan极」的字典解释是:一种栅zha状电极 (╯°Д°)╯︵ ┻━┻

「溃hui脓」的字典解释是:伤口溃kui烂 (╯°Д°)╯︵ ┻━┻

「雀qiao子」的字典解释是:雀que斑 (╯°Д°)╯︵ ┻━┻

「疟yao子」的字典解释是:疟nue疾 (╯°Д°)╯︵ ┻━┻

「桑葚ren儿」 = 「桑葚shen」 (╯°Д°)╯︵ ┻━┻

「貉he」通称「貉hao子」 (╯°Д°)╯︵ ┻━┻

「荨qian麻」「荨xun麻疹」,这个应该是误读过多的影响。

「摩挲」念 mo suo 时表示「用手抚摩」,念 ma sa 时表示「用于轻轻按着并一下一下地移动」😰

几乎只在某一固定词语或中使用的读音,多数为地名,不太了解这种读音是怎么产生的,为什么在历史发展的过程中没有被其他常用读音给替换掉。

「豸zhi」的「冠豸zhai山」。

「蚌beng埠」的「蚌bang」。

「咀ju」的「尖沙咀zui」。

「厦sha」的「厦xia门」。

「柞zuo」的「柞zha水」。

「栎li」的「栎yue阳」。

「栟bing」的「栟ben茶」。

「泌mi」的「泌bi阳」。

「桧gui」唯独在人名里念「hui」,「秦桧hui」,应该是自秦桧以后没人起带「桧」的名字了。

「絜xie」唯独在人名里念「jie」,应该是简化时的附带问题。

「殖zhi」的「骨殖shi」。

「氏shi」的「阏氏zhi」。

「峙zhi」的「繁峙shi」。

「筠yun」的「筠jun连」。

「泷long」的「泷shuang水」。

「洞dong」的「洪洞tong」。

「浚jun」的「浚xun县」。

「单dan」的「单shan县」和「单chan于」。

「浰li」的「洴浰lian」。

「牟mou」的「牟mu平、中牟mu」。

「番fan」的「番pan禺」。

「磅bang」的「磅pang礴」。

「筠yun」的「筠jun连」。

「绿lv」的「绿lu林、鸭绿lu江」。

「缩suo」的「缩su砂密」。

「荠ji」的「荸荠qi」。

「荥xing阳」「荥ying经」两个地名两个音,且这个字基本上只在这两个地名中使用。

「莞wan」的「东莞guan」。

「迫po」的「迫pai击炮」。

「铅qian」的「铅yan山」。

「阿e房pang宫」。

「育yu」的「杭育yo」。

「瀑pu」的「瀑bao河」。

「缩suo」的「缩su砂密」,这个读音简直莫名其妙!

前面的读音不知道是如何产生的,但是下面这些外来的音译也用了一个很生僻的发音,感觉莫名其妙。

「哪ne吒」。

佛教用语「南na无mo」。

「呗bei」的「梵呗fan bai」。

「犍qian陀罗」,「犍qian/jian」,又生僻又是多音字。

「戛jia/ga」发 ga 音时,只用于「戛ga纳」,那为什么不用一个本来就发 ga 音的字呢?

「秘mi/bi」发 bi 音时,只用于「秘bi鲁」,那为什么不用一个本来就发 bi 音的字呢?为什么而且 Peru 的发音类似 po 而不是 bi。

「派pai/pa」发 pa 音时,只用于「派司」,表示 pass,那为什么不用一个本来就发 pa 音的字呢?

字典与日常常用的不太一样

「别介jie」(天津话的「别这样啊」),字典正字是「别价jie」。

「干嘛má」(干啥),字典正字是「干吗má」。

「瞅你咋地di」,字典正字是「咋的di」。

音译用字的混乱

「傅立叶」「傅里叶」。

「菲利浦」「飞利浦」「菲利普」。

「笛卡儿」「笛卡尔」。

「喜玛拉雅」「喜马拉雅」。

「碧昂斯」「碧昂丝」。

「汉摩拉比、汉漠拉比、汉漠拉比、汉莫拉比」「汉谟拉比」。

「札」与「扎」的混用。

「诺亚方舟」「挪亚方舟」。

「克里Kerry」「克利Klee」。

「克利斯Klis」「克里斯Chris」「克莉丝Chris」「克丽丝Kris」「科利斯Corlys」。。。

「峇株巴辖」这种译名更扯淡,「峇厘岛」已经改译为「巴厘岛」了,这译名居然弄了两个不同的 ba。

「恺撒」与「凯撒」。

还有一大堆这种混用的音译字:

爱、艾、埃

里、力、立、利、丽

思、丝、司、斯

亚、娅

哥、歌、戈、格

尼、妮

帝、迪、蒂、狄

儿、尔

伯、勃、博

福、弗、富、辅、芙、佛、

最经典的还得是下面这条修订记录:

「玛丽雅、玛丽亚、马丽娅、马里亚、马丽亚、玛利娅、玛丽娅、玛莉亚、玛俐亚」→「马利亚、玛利亚」🤦‍♂️

古希腊文学翻译家罗念生先生针对后面是否接元音分别使用了「忒」和「特」做不同的译名,如「忒修斯」「忒弥斯」都没有用「特」,而是用一个生僻的多音字「忒te tei tui」(在这里念 tè)。

这种「规则」的优劣且不说,但「统一用字」是好的,「制定并完全遵守规则」也是好的,而目前则是没有统一,也没有规则。

有朋友提了个 issue 说《原神》角色「优菈」打不出来,不明白为什么米哈游要使用一个没人用的「菈」而不使用常见的「拉」,谷歌图片搜索「菈」,出来的全是原神的内容。要是都不遵守惯用套路,译名选字还要选《通用规范汉字表》和《现代汉语词典》都没有收录的字,那真是乱套了。

最让人无语的状况莫过于一个多音字在译名中以多种发音出现,例如:

  • 伽 jia ga qie

    • 伽利略 jia li lve
    • 奥米伽 ao mi ga
    • 伽蓝 qie lan
  • 佛 fo fu

    • 佛罗里达 fo luo li da
    • 雪佛兰 xue fu lan

另外「伽」在外语原文发音为 ga,但在译名中念 jia 的情况有很多。

(╯’ - ‘)╯︵ ┻━┻

(╯’ - ‘)╯︵ ┻━┻

(╯°Д°)╯︵ ┻━┻

简繁或地区的一些不同

表示打招呼或惊诧时的语气词,繁体有个「誒」,但《现汉》《现规》《通用汉字规范表》都没有收录「诶」,大陆用的是「欸」。

「蕃茄」「番茄」,其他使用汉语的地区基本都是「蕃」,中国大陆是「番」。

简化字没有简化「噹 → 𪠽」,这个拟声词还是很常用的,字典中是以「当」代替的。

简化字没有简化「襬 → 䙓」,而是使用了「摆」,「衣摆、裙摆」。

热门但错误的商用

「比萨」「匹萨」「披萨」,「比萨」是《现汉》推荐的,但 pizza 发音明明是 pi,很多商家都在用后两个,不过比萨行业龙头之一的必胜客使用了「比萨」,现在用「比萨」的也比较多了。但日常发音与广告中都在使用 pi 的音,《现汉》却至今没有更改推荐字或读音。

「拉钩」是正确用字,但「拉勾网」用的是「勾」。

表汽车喇叭时用「嘀嘀」,但「滴滴打车」是「滴」。

告五人的歌曲《披星戴月的想你》应该用「地」。

希腊字母 sigma 的正确写法是「西格马」,但行业术语「六西格玛」使用了不同的 ma。