信息中心 / NEWS CENTER
亿岸通过各个角度来浅析搜索引擎工作原理 上海网站建设 | 上海网站设计 时间:2012-10摘要:在网络推广搜索引擎分类部分我们提到过全文搜索引擎从网站推广提取信息建立网页数据库的概念。网络搜索引起的工作原理,从企业大局观上来考虑必须要建立以及了解,不了解搜索引起的工作原理,在工作中就不知道到底哪些搜索是有用的对于搜索引擎有好处的,哪些是没用的,以免浪费不必要的时间和精力了。
网站推广搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间,网络推广搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。这种蜘蛛程序各个搜索引擎都是有其不同的地方,这个也是各个搜索引擎公司他们的核心技术所在,我们通常认为百度之所以在国内能够做到巨无霸,一方面是因为其营销方式更加适合中国特色,另一方面,百度的蜘蛛团队有着国际领先水平的蜘蛛开发力量,这一点比谷歌中国都要高出很多,比其他的搜索引擎那就更加是高出太多了,所以百度才能够做的这么好。
另一种是提交网站推广搜索,即网站拥有者主动向网络推广搜索引擎提交网址,它在一定时间内定向向你的网站派出“蜘蛛”程序,扫描你的网站推广并将有关信息存入数据库,以备用户查询。由于近年来网络推广搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入网络推广搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让网络推广搜索引擎有更多机会找到你并自动将你的网站推广收录。
当用户以网站推广关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
目录索引
与全文网络推广搜索引擎相比,目录索引有许多不同之处。 通过这些索引我们可以在今后的网站建设工程中注意到目录的重要性,比如网站地图,有清晰的网站地图能够使得浏览者一方面能够很清楚的指导网站的拓扑架构图,另一方面也可以使得蜘蛛爬虫也更加清楚该如何通过索引来第一时间抓取网站的重点信息所在,亿岸网络通过研究搜索引擎发现,在目录索引中我们可以这么说,他们在搜索引擎研究中占据着非常重要的研究重要性!
首先,网络推广搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。
其次,网络推广搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其象雅虎这样的超级索引,登录更是困难。
此外,在登录网络推广搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录。
最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站推广信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。
目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择网站推广关键词搜索,也可按分类目录逐层查找。如以网站推广关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定。
目前,网络推广搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索,如谷歌就借OpenDirectory目录提供分类查询。
总结:雅虎这些老牌目录索引则通过与谷歌等网络推广搜索引擎合作扩大搜索范围。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如国内搜狐、新浪、网易等;而另外一些则默认的是网页搜索。
返回上页