




















1 pushMeUp 2024 年 3 月 15 日第一个问题,不知道 第二个问题 |
2 ghostwind 2024 年 3 月 15 日1. 第一个问题的话,你看下是不是汤锅变成了一个实体词。 2. 之前我们做的时候是 case by case 你把护肝作为一个实体词,不允许拆分。 PS:单字的搜索可以不优化,因为不准 |
4 wu00 2024 年 3 月 15 日es 也有 explain 的自己看一下就知道了 |
6 996635 2024 年 3 月 15 日关键词:HMM |
7 wu00 2024 年 3 月 15 日大厂咱不知道,肯定没这么简单,应该有搜索引擎团队。 |
9 zakokun 2024 年 3 月 15 日ES 支持指定 tokenizer 做分词测试,你可以指定你们线上用的 tokenizer ,然后把商品名称输入进去,查看返回分词结果. 按照你给的例子,第一个情况是分词器把你“汤锅”作为一整个 token ,所以用“锅”搜不到; 第二个情况是分词器拆分出“护”这个 token ,然后你的关键词也拆出了“护”,所以匹配到了。 规则和搜索匹配方式都需要开发自己去指定,包括匹配度,还有分词器,停用词,词库什么的,要和产品商量好。 |
10 zakokun 2024 年 3 月 15 日@zakokun 当然怎么拆还是看你配置,不一样是这样拆分的,你可以用_analyze 接口,带上你的分词器和查询内容,看看把它分成了什么,再对比你的搜索语句 |
12 chippai 2024 年 3 月 15 日1. 汤锅是一个词,在 ik-max-word 分完后创建的是一个完整的汤锅索引,所以锅搜不出来 |
13 chippai 2024 年 3 月 15 日2.2 可以先将 query 词使用 match_phrase 函数,然后 should 上 match 函数;增加 match_phrase 的分值权重 |
14 publicWyt 2024 年 3 月 15 日这个时候就要参考一下 PDD 等网站了,搜搜看汤锅,商家的 title 是很大一串的相关锅词汇,目测是为了提高检索的命中,也为了让分词器更精准的分离出关键词,汤锅在_analyze 确实是不会分词到锅,但是平底锅高压锅等乱七八糟的都可以 |
15 matrix1010 2024 年 3 月 16 日 via iPhone商品名这种短字符就别 ik 了,直接单字+2gram |
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。