首页 > 考试题库
题目内容 (请给出正确答案)
[单选题]

在网络爬虫策略中需要根据链接计算网页重要性的是以下哪个算法()?

A.深度优先

B.OPIC

C.广度优先

D.局部PageRank策略

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“在网络爬虫策略中需要根据链接计算网页重要性的是以下哪个算法(…”相关的问题
第1题
PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当
网页甲有一个链接指向网页乙,就认为乙获得了甲对它贡献的分值,该值的多少取决于网页甲本身的重要程度,即网页甲的重要性越大,网页乙获得的贡献值就越高。由于网络中网页链接的相互指向,该分值的计算为一个迭代过程,最终网页根据所得分值进行检索排序。

互联网是一张有向图,每一个网页是图的一个顶点,网页间的每一个超链接是图的一个边,邻接矩阵B=(b)w如果从网页i到网页j有超链接,则by=1,否则为0。

记矩阵B的列和及行和分别是它们分别给出了页面j的链人链接数目和页面i的链出链接数目。假如在上网时浏览页面并选择下一个页面的过程,与过去浏览过哪些页面无关,而仅依赖于当前所在的页面。那么这一-选择过程可以认为是一一个有限状态、离散时间的随机过程,其状态转移规律用Markov链描述。定义矩阵A=(ay)wxn为式中:d是模型参数,通常取d=0.85;A是Markov链的转移概率矩阵;ay表示从页面i转移到页而j的概率。根据Markov链的基本性质,对于正则Markov链存在平稳分布x=式中:x为在极限状态(转移次数趋于无限)下各网页被访问的概率分布,Google将它定义为各网页的PageRank值。假设x已经得到,则它按分量满足方程网页i的PageRank值是划,它链出的页面有τ个,于是页面i将它的PageRank值分成r份,分别“投票"给它链出的网页。x为网页k的PageRank值,即网络上所有页面“投票给网页k的最终值。根据Markov链的基本性质还可以得到,平稳分布(即PageRank值)是转移概率矩阵A的转置矩阵AT的最大特征值(=1)所对应的归一化特征向量。

已知一个N=6的网络如图4.8所示,求它的PageRank取值。

点击查看答案
第2题
张先生近几天多次收到房管局通知需要登记电子房产证的短信,短信内有一个网站链接,张先生点击网页并填写了个人信息及银行卡号、登陆密码,并根据提示输入了验证码,随后查询银行卡发现被扣款一笔23919.22元。以下说法正确的是:()

A.没关系,张先生的钱会退还回来的

B.房管局办理业务时不会要求输入银行卡和验证码

C.张先生按照正确的途径办理了电子房产证

D.可以在陌生网址中填写银行卡和验证码

点击查看答案
第3题
以下哪个步骤不属于数据的采集与预处理()

A.利用ETL工具将分布的、异构数据源中的数据,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中

B.利用日志采集工具把实时采集的数据作为流计算系统的输入,进行实时处理分析

C.利用网页爬虫程序到互联网网站中爬取数据

D.对分析结果进行可视化呈现,帮助人们更好地理解数据、分析数据

点击查看答案
第4题
搜索引擎优化的基本策略通常分为()。

A.关键词策略

B.网页优化策略

C.链接策略以及网站取名

D.域名的选择个主机服务器的选择等

点击查看答案
第5题
下列关于网页内容编排选项中的表述不准确的是()A. 内容段落中链接不宜过多 B. 图像、声音等文

下列关于网页内容编排选项中的表述不准确的是()

A. 内容段落中链接不宜过多

B. 图像、声音等文件运用过多容易导致网民流失

C. 重要的内容放在页面右上角和顶部,然后按重要性递减顺序由上而下放置其他内容

D. 重要内容不适合放在深度链接中

点击查看答案
第6题
增量式网络爬虫只会在需要的时候爬行新产生或发生更新的页面。()
点击查看答案
第7题
中断与因特网的链接称为离线,也称为脱机,脱机后用户将不能()。

A.浏览网页

B.编辑网页的源文件

C.阅读电子邮件

D.搜索网络信息

点击查看答案
第8题
在WAF纵深防御体系中,以下哪个选项属于内容安全检查的范畴?()

A.网络爬虫检查

B.SQL注入攻击

C.敏感言论的提交

D.安全基线的设置

点击查看答案
第9题
相互链接的网页不能分布在不同的web服务器中。()
点击查看答案
第10题
下面关于网页描述,其中说法正确的是。

A.网页分为静态网页和动态网页

B.在一个网页中用来超链接的对象只能是文字

C.Dreamweaver可用于制作网页

D.超链接是指从一个网页指向另一个目标的链接关系

点击查看答案
第11题
网站流量是指网站的访问量,其常用的统计指标包括网站的独立用户数量,总用户数量(含重复访问量),网页浏览数量,每个用户的页面浏览数量,用户在网站的平均停留时间等。根据上述定义,下列不能直接用来提高网站流量的是()。

A.丰富网页的展示内容

B.提高网民信息的甄别能力

C.增强与相关网站的链接

D.在其他媒体上发布网站广告

点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改