Abstract
"以人类的笑话文本为基础,比较评测了4个大语言模型生成幽默笑点句的能力。总的来看,目前DeepSeek-R1的中文幽默生成能力强于GPT-4o、Qwen2.5-7B和Qwen3模型 , 但 距 离 人 类 的 幽 默 能 力 还 有 明 显 的 差 距 。 各 模 型 基 于 固 定 表 达 生 成 笑 点 句时,或多或少存在“思维定势”问题。测查了人类与大语言模型幽默文本的9项语言特征。DeepSeek与人类的相似笑点最多,BLEU-4匹配度也最高。与人类相比,AI生成的笑点句更倾向于使用高频常见的词,未登录词、网络新词的比例更低,在长度上普遍更长。基于Sentence-BERT模型获取语义表示,大模型的笑点句在语义联想距离上普遍比人类的笑点句更短。强化谐音双关、语义双关等修辞手法的运用,是大模型提高幽默文本生成能力的重要途径。最后,我们讨论了本文评价方式的优劣,并展望了增强大模型幽默能力的3个策略:优化提示工程、构建幽默多模态大模型、在推理中增强幽默文本的可解释。"
- Anthology ID:
- 2025.ccl-1.3
- Volume:
- Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
- Month:
- August
- Year:
- 2025
- Address:
- Jinan, China
- Editors:
- Maosong Sun, Peiyong Duan, Zhiyuan Liu, Ruifeng Xu, Weiwei Sun
- Venue:
- CCL
- SIG:
- Publisher:
- Chinese Information Processing Society of China
- Note:
- Pages:
- 28–36
- Language:
- URL:
- https://aclanthology.org/2025.ccl-1.3/
- DOI:
- Bibkey:
- Cite (ACL):
- Yanting Jiang and Yizhou Ying. 2025. DeepSeek等大语言模型幽默生成能力及其特征的评测分析. In Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025), pages 28–36, Jinan, China. Chinese Information Processing Society of China.
- Cite (Informal):
- DeepSeek等大语言模型幽默生成能力及其特征的评测分析 (Jiang & Ying, CCL 2025)
- Copy Citation:
- PDF:
- https://aclanthology.org/2025.ccl-1.3.pdf

















