A、中文分词技术采用了基于符号的方法来识别
B、查准率是衡量系统在实施某一作业时检出相关文献能力的一种测度指标,是对检索遗漏程度的度量
C、机器学习的四个步骤中,文档特征抽取是指利用抽取算法抽取查询词TF/IDF信息、文档长度、网页PageRank值、网页入链/出链数量等
D、动态索引包含2个关键的索引结构:倒排索引、临时索引
A.受单元分匹配模式系数控制的关键词,不可修改其匹配模式
B.设置关键词“不接受”分匹配模式控制后,方可对其修改匹配模式
C.单元层级设定分匹配模式出价系数后,单元下所有关键词(包含新增关键词)默认接受单元控制,匹配与各匹配下出价随之变化
D.如个别关键词需要单独设定,可在关键词层级,对该关键词进行控制
B.routing.allocation.total_shards_per_node:2,该设置作用为单个节点最多分配两个分片(包含主分片和副本)
C.日志平台的应用数据索引每天拆分为11个,可以提升查询速度,原因是相同的查询,检索的分片数据减少了
D.hostName字段类型为keyword,当使用hostName:WGQRZPTAPP0能搜索到主机名为WGQRZPTAPP01、WGQRZPTAPP02、WGQRZPTAPP03......的日志