首页 > 考试题库
题目内容 (请给出正确答案)
[主观题]

4 寻找热门查询: 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串

4 寻找热门查询:

搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。假设目前有一千万个记录,这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。请你统计最热门的10个查询串,要求使用的内存不能超过1G。

(1)请描述你解决这个问题的思路;

(2)请给出主要的处理流程,算法,以及算法的复杂度。

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“4 寻找热门查询: 搜索引擎会通过日志文件把用户每次检索使用…”相关的问题
第1题
4 寻找热门查询: 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询

4 寻找热门查询:

搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。假设目前有一千万个记录,这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。请你统计最热门的10个查询串,要求使用的内存不能超过1G。

(1)请描述你解决这个问题的思路;

(2)请给出主要的处理流程,算法,以及算法的复杂度。

点击查看答案
第2题
MySQL中,关于各类日志文件叙述正确的是()

A.二进制日志会以二进制的形式记录数据库的各种操作,并记录查询语句

B.错误日志会记录MySQL服务器启动、关闭和运行时出错等信息

C.通用查询日志记录执行时间超过指定时间的各种操作,通过工具分析慢查询日志可以定位MySQL服务器性能瓶颈所在

D.慢查询日志记录MySQL服务器的启动和关闭信息、客户端的连接信息、更新数据记录SQL语句和查询数据记录SQL语句

点击查看答案
第3题
以下关于慢查询日志说法正确的是()。

A.MySQL默认启动慢查询日志

B.慢查询日志只记录响应时间超过阈值的语句

C.慢查询会导致CPU、内存消耗过高

D.开启慢查询日志不会影响数据库性能

点击查看答案
第4题
在天网Maze中,检索词包括多个关键词时,不需要使用“AND”语法,只要用()隔开关键词就可以了,搜索引擎会自动运行“AND”语法进行检索,提供符合查询条件的网址列表。

A.逗号

B.分号

C.空格

D.回车

点击查看答案
第5题
通过查询日志,可以及时发现非法操作记录、设备故障原因等信息,查询OMU安全日志的指令是()

A.LSTLOGKP

B.LSTSECLOG

C.LSTOPTLOG

D.LSTEVTLOG

点击查看答案
第6题
GPRS流量争议类投诉,如果是CMWAP可以通过WAP网关查询用户访问日志,如果WAP网关查询不到用户日志,那么用户就一定没有上网。()
点击查看答案
第7题
关于慢查询日志的说法,正确的是()。

A.慢查询日志主要用来记录执行时间超过指定时间的查询语句

B.通过查询慢查询日志,可查找哪些查询语句的执行效率低,从而找到MySQL服务器的性能瓶颈并进行优化

C.默认情况下,慢查询日志是开启的

D.慢查询日志和二进制日志类似,也可保存DML语句

点击查看答案
第8题
关于全文搜索引擎描述不正确的一项是()。

A.通过用户输入关键词来进行查找

B.全文检索、检索功能强、信息更新速度快是全文搜索引擎的优点

C.需要建立层次目录

D.提供的查询结果重复链接较多,层次结构不清晰,往往给人一种繁多杂乱的感觉

点击查看答案
第9题
我们可以使用哪些工具寻找网络热点?()

A.百度风云榜

B.微博热门榜

C.百度

D.微信

点击查看答案
第10题
在启信宝页面进行企业查询时,不仅可以通过企业的特质条件满足或不满足进行查询,还可以通过灵活的定制来查询目标企业,寻找目标客户。()
点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改