计世网
首页 | 资讯   独家分析 专题 人物 科技 | 资源   信息化 方案案例 CIO文库 周报全文 企业中心 职场 电子杂志 社区联盟
互动   创业 Wiki 博客 社区 视频 直播 | 产品   服务器 商用软件 存储 安全 网络通信 智能手机 笔记本 台式机 芯片 办公
iPhone 地震 CCBN Moto分拆 CIO ERP Vista 智能手机 工信部 N95 P2P WLAN 四核服务器 Nvidia 安全 IT两会 互联网年会 奥运频道
 您的位置: 计世网 > 资讯中心 > 互联网 > 正文
·华为“自杀式报价”曝光 拼死竞逐C网订单
·揭开Windows Vista瘦身版的真实面纱
·保卫奥运音视频版权 央视国际频出狠招
·C区蓝光影碟中国售价确定 卓越独家首发
·Sun公布08财报 “金砖四国”成绩突出
·反垄断法第一案:北京网通遭遇诉讼
·律师:番茄花园案或将引出微软垄断案
·方兴东:番茄花园案暴露微软中国反盗...
·惠普授予全球41名教授“创新研究奖”
Google 网页排名背后的技术 [收藏] [打印] [推荐]
作者:  2008-07-18 11:15:34

这是 Google 工程师 Amit Singhal 发表在 Google 官方博客的一篇文章,讲述了 Google 搜索排名背后的一些技术,涉及到 Google 对网页,对语义,对用户意图的理解。

Google 搜索排名的核心技术源自已有50年历史的学术课题 Information Retrieval (IR),IR 技术使用统计学原理对文字的使用频率等属性进行研究并对结果进行排名。建立在 IR 理论上的 Google 搜索同时借助链接,网页结构等等技术形成独特的搜索技术。

理解网页:

Google 多年来在网络爬虫与索引系统上投入巨资,因此,Google 拥有非常庞大并且是最新的网页索引,除此之外,Google 还使用一些最新技术提高索引质量,比如,他们开发了一种技术,可以在字面意思之外理解一个网页所表达的重要概念,人们使用意大利语言搜索 "galleria sprovieri londra",会找到伦敦的 Sprovieri Gallery,尽管 Sprovieri Gallery 主页上既没有 London,也没有 Londra 字样。在美国,人们搜索 "cool tech pc vancouver, wa",会找到 www.cooltechpc.com,然而 www.cooltechpc.com 的主页上没有任何文字表明他们位于 Vancouver。其它技术包括,区分一个网页中的重要或非重要文字,以及网页内容的新鲜度。

理解语义:

Google 可以通过用户提供的几个搜索关键词,理解用户的真实意图。他们在拼写纠正,词义,以及概念分析方面处于非常领先的位置。很多人都或多或少体验过 Google 的拼写纠正功能,比如搜索 "kofee annan",Google 会问你搜索的是否 "kofi annan",然而,当有人搜索 "kofee beans",Google 会纠正成 "coffee beans"。(Google 事实上已经在尝试语义技术 - 译者)

词义是 Google 尝试理解查询语义的基础,也是 Google 遇到的最大难题。一些在人看来显而易见的东西,机器却很难自动处理。用户并不想对使用什么词汇进行查询而费神,人们甚至压根不知道该使用什么进行查询。在这种时候,Google 的词义系统便可以发挥作用,词义系统可以对查询语句进行非常复杂的修正,比如,查询 "Dr Zhivago" 的时候,Google 知道 Dr 代表 Doctor ,而查询 "Rodeo Dr" 的时候,Dr 代表 Drive。用户搜索 "back bumper repair" 的时候,结果是 rear bumper repair,而搜索 "Ramstein ab",Google 能够将 ab 理解成 Air Base,"b&b ab" 会理解为 Alberta 的 Bed and Breakfasts 。Google 将这种词义理解系统发展到上百种不同语言。

Google 在搜索排名中使用的另一项技术是概念识别,该技术可以对查询的内容进行概念识别,比如,我们查询 "new york times square church",Google 知道我们实际上查询的是纽约时代广场上的那座著名教堂,而不是纽约时报中的某篇文章。概念识别技术并不止这些,Google 还对其进行加强以正确地识别语义,比如,搜索 "PC and its impact on people",事实上是搜索计算机对社会的影响。Google 的搜索分析算法中这类技术比比皆是,而且面向几乎所有语言。

理解用户:

Google 尝试理解用户的目的是为用户返回他们真正需要的结果,而不是他们在搜索语句中所说的东西。该技术基于一个世界级的本地化系统,外加先进的个性化技术,以及各种用户意图识别技术。

Google 对本地结果的重视体现在他们的本地化工作中。同样一个查询语句在不同国家会返回不同结果,比如,查询 "bank]",在美国返回的是银行,而英国则可能是 Bank Fashion 的服装连锁店,或者英国的银行,而在其它英语国家,如澳大利亚,加拿大,新西兰,南非,返回的则应仍旧是当地的银行。如果你在一些非英语国家查询这个词,象埃及,以色列,日本,俄罗斯,沙特,瑞士,返回的结果将更有趣。就象 Football 在美国和英国表示不同的运动项目一样,同一个词在不同国家查询的结果可能截然不同。

个性化查询是 Google 另一项先进搜索技术,一个已经登录的用户,如果开通了 Web History 服务,随着他查询时间的增长,Google 会根据他的查询历史,自动调整返回的结果,比如,一个经常查询 Football 相关话题的人,会逐渐从 Google 得到更多足球相关的结果。如果你青睐某个购物站返回的结果,在以后的查询中,会从那个购物站得到更多结果。

Google 在返回用户真正想要的结果方面的另一个例子是,假如你搜索 "chevrolet magnum",我们知道 Magnum 不是 Chevrolet 产的,是 Dodge 产的,Google 会自动返回 dodge magnum 的结果。还有一个例子,有人搜索 "bangalore",不仅返回 Bangalore 这个城市的主页,而且返回 Bangalore 的地图,以及一些与 Bangalore  市景,交通相关的视频,这些视频会让你有身临其境的感觉。

网页编辑:King
本文关键字: Google 网页排名
如果您对“Google 网页排名背后的技术”有任何疑问要咨询,或您对我们专家的解答有任何疑义,请您点击以下的链接提交意向单,我们的编辑和信息化专家将会很快为您做出回答,您提供的信息经过审核后将有机会出现在我们的网页上。
  专家介绍
相关文章
·周鸿祎学到了Google的“不赚钱之道”
·Google手机平台并不公开 被指违反开源原则
·谷歌Lively出现成人聊天室(图)
·Symbian在操作系统层次和Google合作
·云计算趋势:全球只需5台电脑?
推荐文章
·国内最大修改版XP番茄花园作者被捕
·海盗湾提供BT下载北京奥运会视频被诉
·网通8M ADSL三个月仅发展用户1000人
·FCC判定运营商Comcast限制P2P违规
·计世独家:刀片,我拿什么给你开刃
文章评论 您的姓名 您的Email
  
频道热门导航
人物 互联网 信息安全 网络通信 消费电子 行业应用 会展信息 科技前沿 数字生活
计世网热门导航
资讯中心 信息化 商用软件 服务器 方案案例 智能手机 笔记本 手机社区 笔记本社区
热门文章排行 更多
·1/3商用Vista PC主动降至Wi...
·华为“自杀式报价”曝光 ...
·中国版EIOffice 09支持UOF...
·联想回应撤销刘翔广告事件...
·刘翔退赛 网民如何看待
·可能取代Windows的7个操作系统
·百度全球首家告别硬盘 启...
·刘翔退赛令世界媒体感到意...
Informatica--数据集成业务
开源精神的化身--Linux
热门关键字导航
·BT ·云计算 ·苹果 ·SAAS ·雅虎 ·TD ·谷歌 ·B2C ·Linux ·家乐福 ·iPhone ·唐骏
文章搜索
专题推荐 更多
盖茨与中国:剪不断理还乱的不解情缘
工业和信息化部人员编制确定 正式挂牌
·2008欧锦赛:IT人的饕餮之夜
·国产手机五大怪:山寨当道不知啥叫高档
·独家:凯明之死,TD史上最大阴谋?
·“3.15”:CIO猛揭IT厂商七宗罪
·参加问卷调查,赢取PSP大奖
·从N800看未来商务手机设计思路
论坛热贴 更多
·美上市公司CEO保安费支出...
·传AOL欲进中国市场 开始招...
·思科表示要很快撤销Linksy...
·韩机顶盒高层被捕 涉嫌向...
·第六届中国软交会亮点纷呈
关于我们 | 客服热线 | 广告服务 | 招聘信息 | 法律声明 | 投稿指南 | 联系方式
Copyright(C) ccw.com.cn,All rights reserved
中国计算机世界出版服务公司内容版权所有
京ICP证010182