onenote搜索机制详解⑦:中文搜索中那些令人发指的Bug

原创 小斯  2020-08-22 21:41 

onenote桌面版中文搜索Bug多到、奇葩到令人发指,堪称地表最强笔记本的最大污点。

不过这里需要为onenote正名一下:桌面版英文搜索、网页端的中文搜索基本是正常的,这些Bug主要出现在桌面版的中文搜索上。这种结果似乎也好理解,微软压根就没把onenote当回事,就更别提onenote中文版了,能凑合用就不错了。

以下示例中,搜索关键词“反思”,黄色代表已匹配,红色代表无法匹配。

1

段首以非中文开头,一般,搜不到后面的关键词

例如段首以数字、字母、符号、日文、韩文等字符开头时,搜索不到关键词。

这里需要注意的是,自动编号并不算作内容字符,例如下图中的自动编号“1”、“A”是内置格式,而非内容,真正的内容仍然是以“小斯想”开头,所以能被检索。

但手写的编号“1”、“A”就不同了,就是字符,这种情况下,后面的内容无法检索。这个坑爹Bug带来的启示:能用自动编号时就别用手写了,小心无法检索。

onenote搜索机制详解⑦:中文搜索中那些令人发指的Bug onenote 第1张

既是一般,那就有例外,例如字母和数字开头时,关键词前若用符号隔开,就能匹配,但其他情况下仍然不能匹配。

onenote搜索机制详解⑦:中文搜索中那些令人发指的Bug onenote 第2张

2

非手动输入内容,全部或部分搜索不到

凡不是手动输入的内容,都可以归到这类,具体的例如从外面(例如网页)复制、三方插件发送进onenote等等这样的内容。

这类笔记,有可能会出现一些奇葩的Bug。

对于明显存在的字词,若全部搜索不到,很可能是索引尚未更新。

不过即便重建索引后,可能还是有大部分搜不到,这时涉及到另一个奇异Bug,也就是①中的那个例外:只有符号后紧邻的字符串,或段首的字符串才能被检索。(注意这里的区别,①中,只要段首是中文开头,关键词都能被搜索到。但此处,段首为中文也没用,仍然只有符号后的字符串能被搜索到)

例如下图,黄色代表已匹配的结果:要么在段首,要么字符串前面有符号分割;红色代表无法匹配的目标字符串:只要该字符串前面有汉字、字母或数字等非符号内容,就无法被匹配。

onenote搜索机制详解⑦:中文搜索中那些令人发指的Bug onenote 第3张

注意,这个Bug是有可能出现,但具体因何导致,恐怕只有项目组才有可能查清楚了。这Bug着实令人抓狂,变着花样耍你玩。

例如有网友反映,从网页复制过来的内容有类似搜索Bug,但我目前还没遇到;我遇到的是从三方插件导入的内容会有此Bug,但也不绝对,部分有部分无,有点像薛定谔的Bug,你无法确定当前这个页面是否会有此Bug,除非动手搜一下。


以上就是我目前遇到的onenote中文搜索最大的两类Bug,按照具体使用情境不同,这两类Bug对搜索效率的破坏性也不同,最严重的情境下,onenote搜索几乎是形同虚设。

不过,既然无法寄望于微软的改变,那就先认识目前这个存在各种缺陷的搜索机制,然后再有针对性地建立起一套相对高效的搜索范式。

本文地址:http://cas01.com/5948.html
关注我们:请关注一下我们的微信公众号:扫描二维码小斯想的公众号,公众号:cas01
温馨提示:本站发布的压缩包如需密码解压,若无特别说明,密码统一为:cas01.com
版权声明:本文为原创文章,版权归 小斯 所有,欢迎分享本文,转载请保留出处!

发表评论


表情