A、中文分词技术采用了基于符号的方法来识别
B、查准率是衡量系统在实施某一作业时检出相关文献能力的一种测度指标,是对检索遗漏程度的度量
C、机器学习的四个步骤中,文档特征抽取是指利用抽取算法抽取查询词TF/IDF信息、文档长度、网页PageRank值、网页入链/出链数量等
D、动态索引包含2个关键的索引结构:倒排索引、临时索引
互联网是一张有向图,每一个网页是图的一个顶点,网页间的每一个超链接是图的一个边,邻接矩阵B=(b)w如果从网页i到网页j有超链接,则by=1,否则为0。
记矩阵B的列和及行和分别是它们分别给出了页面j的链人链接数目和页面i的链出链接数目。假如在上网时浏览页面并选择下一个页面的过程,与过去浏览过哪些页面无关,而仅依赖于当前所在的页面。那么这一-选择过程可以认为是一一个有限状态、离散时间的随机过程,其状态转移规律用Markov链描述。定义矩阵A=(ay)wxn为式中:d是模型参数,通常取d=0.85;A是Markov链的转移概率矩阵;ay表示从页面i转移到页而j的概率。根据Markov链的基本性质,对于正则Markov链存在平稳分布x=式中:x为在极限状态(转移次数趋于无限)下各网页被访问的概率分布,Google将它定义为各网页的PageRank值。假设x已经得到,则它按分量满足方程网页i的PageRank值是划,它链出的页面有τ个,于是页面i将它的PageRank值分成r份,分别“投票"给它链出的网页。x为网页k的PageRank值,即网络上所有页面“投票给网页k的最终值。根据Markov链的基本性质还可以得到,平稳分布(即PageRank值)是转移概率矩阵A的转置矩阵AT的最大特征值(=1)所对应的归一化特征向量。
已知一个N=6的网络如图4.8所示,求它的PageRank取值。
A.http://localhost/虚拟目录名/网页文件名
B.http://计算机的IP地址/虚拟目录名/网页文件名
C.http://计算机名字/虚拟目录名/网页文件名
D.以上都正确
A.高质量发展评价体系
B.采用机器学习等前沿技术
C.整合企业生长力八大模块136项指标构建企业生长力指标体系
D.描绘企业动态的生长力指数,帮助政府从海量企业中找到具备发展潜力的优质企业
A.建立连接时延
B.下载时延
C.网站首字节响应时延
D.网页展现时延
A.建立连接时延
B.下载时延
C.网站首字节响应时延
D.网页展现时延