在Reaxys里检索结果一旦太多,很多人第一反应就是不停加关键词,结果越搜越乱。真正容易做反的地方,不是条件不够多,而是没有先分清自己该在检索前收范围,还是在结果页继续缩结果。Elsevier官方帮助把这两层分得很清楚:前一层主要靠【Quick Search】和【Query Builder】建查询,后一层主要靠结果页过滤器做【Limit to】和【Exclude】。把这两步分开,检索会顺很多。
一、Reaxys检索结果太多怎么办
结果太多时,不建议先在结果页里盲目一点点勾筛选。更稳的做法,是先回头判断当前查询是不是本来就太宽。官方帮助说明,【Quick Search】更适合快速起步,【Query Builder】更适合做具体和高级检索;如果你一开始就是宽词加宽词,后面过滤器再怎么用,也只是从很大的结果池里往回捞。
1、先看要不要从【Quick Search】切到【Query Builder】
如果你现在只是输入了一个反应名、一个通用词或一个物质名,结果特别大,就别继续在【Quick Search】里硬加描述词了。官方文档说明,【Query Builder】可以拖入多个字段,并用布尔和邻近算符组合,还能把不同字段嵌套起来,这本来就是给缩小范围准备的。
2、先把检索对象收窄
同一个词在Reaxys里可能同时命中文献、反应、物质和靶点。官方结果预览页说明,提交查询后会先给出不同结果类别的预览,你可以再点【View Results】进入具体类别。也就是说,结果太多时,先选准你到底看反应、物质还是文献,比先在混合结果里硬筛更有效。
3、宽词不要直接当最终查询
官方Quick Search指南提到,输入时系统会给出Auto Suggest,帮助把名称和概念收得更准。实际用起来,像通用反应名、常见官能团词、宽泛性能词这类查询,更适合先借自动建议收成更具体的短语,再继续往下搜。
4、结果页过滤器要用在第二步
官方结果页说明,过滤器是和当前结果集相关联的,而且支持【Limit to】和【Exclude】。这意味着过滤器很好用,但它更适合在“主查询已经基本对路”之后再做精修,不适合拿来替代前面的查询设计。
二、Reaxys筛选条件怎么组合
条件组合这件事,关键不是堆得越多越好,而是字段要对、关系要清。Elsevier官方帮助明确写到,在【Query Builder】里可以从右侧字段列表拖入搜索字段,再用Boolean和proximity operators继续细化,而且多个字段组合时还要确认运算符是不是设对了。
1、不同维度用不同字段,不要全塞进一个文本框
官方介绍里说得很清楚,【Query Builder】除了常见索引项,还包括物化性质、生物活性、光谱、文献等字段。也就是说,结构、性质、作者、年份、专利受让人这类条件,最好各放在各自字段里,不要全写成一串自然语言。
2、组合时先用AND收范围
如果你的目标是把结果缩小,最常用的起手组合通常是AND。官方Query Builder示例里就展示了两个querylet用布尔AND连接。对多数检索来说,先把主题条件和限定条件用AND收住,比一开始就上很多模糊写法更稳。
3、需要并列备选时再用OR
当你面对的是同义词、近义反应名称、多个可能命名时,OR才更合适。官方帮助虽然重点强调的是字段拖拽和布尔组合,但它已经明确说明组合逻辑要自己确认,所以OR更适合拿来扩同类表达,不适合在结果已经很多时继续放大池子。这个判断是顺着官方对布尔组合的定义得出的直接用法。
4、字段内部也要注意匹配方式
这一点很实用。官方专利受让人示例里专门提醒,字段值更适合用contains,而不是is。说明在Reaxys里,不同字段不只是“填什么”有区别,“怎么匹配”也会直接影响结果规模。换句话说,筛选条件组合不只是运算符之间的组合,还包括字段内部匹配方式的组合。
三、Reaxys先缩结果还是先叠条件
真正把检索做顺,关键不是多会点过滤器,而是知道什么时候该回去改查询,什么时候继续在结果页里缩。官方资料其实已经把边界给出来了:查询层负责建字段和逻辑,结果页负责基于当前结果集再做【Limit to】和【Exclude】。所以更稳的做法通常不是一条路走到底,而是两层配合。
1、主对象没选准时,先回头改查询
如果你现在连“看文献还是看反应”都还没收住,或者主题词本身太宽,就先回【Edit】或【Edit in Query Builder】改查询,不要继续在结果页细筛。官方结果预览和历史页都支持回到查询编辑,这一步本来就是让你回头收主条件的。
2、主对象已经对了,再用过滤器压结果
当你已经明确是在某一类结果里看,例如只看reactions或只看substances,这时结果页过滤器最值钱。因为官方说明这些过滤器本来就会随着当前结果集变化,属于针对当前结果的二次精修。
3、条件一多时优先保留核心字段
如果组合条件越来越多,更稳的是先保留最能定义主题的字段,再把次级限制放到结果页里筛。这样做的好处是,主查询不会写得太死,后面还能通过【Limit to】和【Exclude】来回试,而不用每次整套重建。这个判断是依据官方把Query Builder和结果页过滤分层设计的逻辑得出的。
4、做成熟查询时记得回看History
官方资料说明,Reaxys会记录本次会话中的搜索和过滤动作,而且可以从【History】里重新查看或编辑查询。对经常做同类检索的人来说,这一步很有用,因为你能直接看出是哪一层把结果缩下来,而不是下次又从头试。
总结
Reaxys检索结果太多时,最有效的做法通常不是一味加词,而是先判断问题出在查询本身太宽,还是结果页还没做二次收敛。查询层更适合用【Query Builder】把对象、字段和逻辑搭清,结果层更适合用【Limit to】和【Exclude】把当前结果再压一轮。真正把这两层分开以后,你会发现很多“结果太多”的问题,根本不是数据太多,而是前面该收的条件还没收准。