搜索引擎是什么?搜索引擎是什么
搜索引擎是:根据用户需求与一定算法,运用特定策略从互联网检索出指定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。

搜索引擎一般是由四部分组成的:
索引管理器:管理带有索引结构的数据,索引结构是一种用于进行检索数据的结构,还会经常进行压缩的索引来达到减少从二级储存加载的数据量,提升检索处理效率的目的。
索引检索器:利用索引进行全文搜索的组件。
索引构建起:从座位检索随想的文本文档中生成索引的组件,通过解析将文本文档分解为单词序列,然后再讲单词序列转换为索引结构。
文档管理器:管理文档数据库的组件,这里面存储着作为检索对象的文档。
什么是搜索引擎?
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
搜索引擎是什么?
什么是搜索引擎,你知道吗?搜索引擎与浏览器是完全不同的,浏览器并不是搜索引擎。想必大家已经是一头雾水,那么就让小编帮大家解开疑惑吧!首先我们来了解何为搜索引擎。
而浏览器是指可以显示网页服务器或是文件系统的HTML文件内容,让用户与这些文件交互的一种软件。简单来说搜索引擎就是一个网站,为用户提供收集到的信息资料,类似于中介的身份。浏览器上的搜索框实质上是搜索引擎和浏览器合作的产物。曾经听过一个很形象的比喻:如果把互联网比作商场,搜索引擎就是导购,浏览器就是逛商场时穿的鞋子。搜索引擎需要用浏览器访问,它是一项检索服务,是根据一定的策略,用特定的计算机程序,从网上搜集、整理信息并呈现给用户。如百度、360、搜狗等都是搜索引擎。每一个浏览器都有自己默认的搜索引擎,像IE的默认搜索引擎是Bing搜索,360极速浏览器的搜索引擎是360搜索,搜狗浏览器默认的搜索引擎是搜狗搜索。
目前我们主流的搜索引擎有360 、百度、搜狗、有道等。下面小编就给大家科普一下几个主要的搜索引擎。1. 百度搜索引擎。
百度是目前全球最大的中文搜索引擎,也是国内使用量最大的搜索引擎,它的创始人是李彦宏、徐勇。它是于2000年1月诞生于北京中关村。2. 360搜索引擎。
它是在2012年8月16日由奇虎360推出的搜索引擎,因为360搜索是依靠360 安全卫士和360安全浏览器所拥有的广大用户群,所以在一开始上线时就获得了很大的流量。360搜索的前身为好搜搜索,后于2016年2月1日更名为360搜索。3. 搜狗搜索。是全球首个第三代互动式中文搜索引擎,诞生于2004年8月3日,其属于搜狐旗下,搜狗搜索的优势在于搜狐原有的网游、博客、论坛等业务已吸引了海量的用户,这使得搜狗在搜索引擎中很快就占据了一席之地。
名词解释:什么是搜索引擎
搜索引擎(英语:search engine)是一种信息检索系统,旨在协助搜索存储在计算机系统中的信息。搜索结果一般被称为“hits”,通常会以表单的形式列出。
搜索引擎为一组项目提供了一个接口,使用户能够指定关于感兴趣的项目的标准,并让引擎找到匹配的项目,这些标准称为搜索查询。在文本搜索引擎的情况下,搜索查询通常表示为识别一个或多个文档可能包含的期望概念的一组单词。有多种样式的搜索查询语法在严格性上有差异。它也可以在以前的站点中搜索搜索引擎中的名称。而一些文本搜索引擎要求用户输入由白色空格分隔的两个或三个字,其他搜索引擎可以使用户能够指定整个文档,图片,声音和各种形式的自然语言。一些搜索引擎对搜索查询进行改进,以增加通过称为查询扩展的过程提供质量集合的可能性。查询理解方法可用于标准化查询语言。
扩展资料:一个完整的搜索引擎需要有网页爬取和收录,建立索引,查询词分析,搜索排序,推荐系统五个部分组成。
1.网页爬取和收录。网络爬虫技术是网页爬取的核心技术,可以通过编写一定的程序或者脚本来对互联网的信息进行抓取。
在网页抓取之后,要构建相应的数据库来存储我们爬取的网页信息。但是互联网的信息具有冗余性,主要原因是各大网站也都会在后台进行爬虫爬取,他们也会通过爬虫来检测一些热点的内容或者文章,然后爬取其信息并对格式进行重新的组织,但其实网页的内容几乎都是一致的。所以在收录爬虫爬取的网页信息之前,我们还要加入一个关键的环节——网页去重,来确保我们数据库中网页的唯一性。
2.建立索引在抓取了网页的信息之后,需要对网页的信息进行解析,抽取到网页的主题内容和类别信息。其主要涉及的技术为文本识别和文本分类技术。网页解析后的输出往往是一些结构化的信息(每个网页的信息完整度是不同的,需要统一对数据进行结构化操作),一般的结构化信息包括网页的URL、网页编码、网页标题、作者、生成时间、类别信息、摘要等等。在获取了网页结构化信息后,就要构建相应的索引了。
为了加快响应用户査询的速度,网页内容通过"倒排索引"这种高效查询数据结构来保存,而网页之间的链接关系也会予以保存。之所以要保存链接关系,是因为这种关系 在网F相关性排序阶段是可利用的,通过"链接分析"可以判断页面的相对重要性,对于为用 户提供准确的搜索结果帮助很大。由于互联网的网页信息是海量的,所以搜索引擎的构建离不开大数据处理平台和云计算技术,目前较为常用的大数据处理平台为Hadoop生态架构。
3.查询词分析。
查询词分析就是query分析或者query聚类。当搜索引擎接收到用户的査询词后,首先需要对查询词进行分析,希望能够结合查询词和用户信息来正确推导用户的真正搜索意图。比如,一个用户输入的查询词为“养水仙花”,那么除了基本的内容匹配外,搜索引擎需要读懂用户,其实用户的查询词还可以这样被理解“水仙花的养法”,“水仙花好养不” 等等近意的查询词。在此之后,首先在缓存中査找,搜索引擎的缓存系统存储了不同的查询意图对应的搜索结果,如果能够在缓存系统找到满足用户需求的信息,则可以直接将搜索结果返回给用户,这样既省掉了重复计算对资源的消耗,又加快了响应速度。
4.搜索排序搜索引擎在分析了用户的查询词以后,如果缓存的信息无法满足用户的查询需求,搜索引擎要根据索引来查询数据库的网页内容,并根据网页内容与用户需求来进行网页排序。网页排序需要众多的因素,其中最为主要的因素为网页内容与用户查询内容的相似度(匹配度),这个不难理解,搜索引擎的基本功能就是查询。如果一个搜索引擎无法为用户提供用户需要查询的内容,那其也就不能称为是一个搜索引擎,所以网页内容与用户查询内容的相似度是网页排序的一个首要依据;另外网页的重要程度也是以关键元素,一个网页的重要程度关乎了网页内容的质量,在满足用户需求的基础之上,用户更加希望获得高质量的内容,这是无可厚非的。
根据上述因素,搜索引擎对查询到的结果进行排序,然后展示给用户。
5.推荐系统其实从不严格的角度来说,整个网页排序的过程就属于一种推荐策略。从严格意义上来说,推荐系统并不属于一个搜索引擎架构的必要环节,而且推荐系统在上述示意图中并没有显示。
但是一个优秀的搜索引擎不止要能分析出用户查询的基本需求,进一步来讲,要能了解到或者猜测用户的可能的下一步需求。目前随着大数据的热潮,各大互联网公司和众多专家认为推荐系统是解决互联网大数据的一种有效途径。而且,最近越来越多个性化推荐知识受到了热捧。其实推荐系统在搜索引擎中往往是以中间页的形式展示的,它的主要作用就是为推荐系统进行导流。
搜索引擎的概念是什么?
搜索引擎(searchengines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。
人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。随着yahoo!的出现,搜索引擎的发展也进入了黄金时代,相比以前其性能更加优越。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。以搜索引擎权威yahoo!为例,从1995年3月由美籍华裔杨致远等人创办yahoo!开始,到现在,他们从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,充分说明了搜索引擎的发展从单一到综合的过程。
然而由于搜索引擎的工作方式和因特网的快速发展,使其搜索的结果让人越来越不满意。例如,搜索“电脑”这个词汇,就可能有数百万页的结果。这是由于搜索引擎通过对网站的相关性来优化搜索结果,这种相关性又是由关键字在网站的位置、网站的名称、标签等公式来决定的。
这就是使搜索引擎搜索结果多而杂的原因。而搜索引擎中的数据库因为因特网的发展变化也必然包含了死链接。
搜索引擎是什么意思?
指仔细查找、搜寻。徐怀中《西线轶事》中:“在树棵里搜索了好久,什么也没有发现。
《文选·王褒》:“玄猿悲啸,搜索乎其间。”李善注:“搜索,往来貌。”明冯梦龙《东周列国志》第五十七回:“赵氏孤在宫中,索之不得,此天幸也!但可瞒过一时耳。后日事泄,屠贼又将搜索。必须用计,偷出宫门,藏于远地,方保无虞。”南朝宋刘义庆《世说新语·政事》:“谢公时,兵厮逋亡,多近窜南塘下诸舫中;或欲求一时搜索,谢公不许。
搜索引擎是什么意思 搜索引擎的含义
1.所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。
2.搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。
推荐问答
最新问答
免责声明:本站部分内容由用户自行上传,如权利人发现存在误传其作品,请及时与本站联系。
冀ICP备13011313号-3