海口網(wǎng)站建設(shè)網(wǎng)

百度搜索引擎兩項(xiàng)重要的專(zhuān)利


百度有兩項(xiàng)專(zhuān)利技術(shù),一項(xiàng)是搜索引擎超鏈分析技術(shù);另一項(xiàng)是搜索引擎投票算法,那么我們就根據(jù)百度搜索引擎排名的核心專(zhuān)利技術(shù)進(jìn)行分析吧!我們租一個(gè)簡(jiǎn)單概況:超鏈分析技術(shù)其實(shí)是將抓取的頁(yè)面包含超鏈接錨文本作為了衡量網(wǎng)頁(yè)相關(guān)性及權(quán)重高低的最基礎(chǔ)算法。任何一個(gè)搜索引擎都可以收錄并索引N多網(wǎng)頁(yè)快照,但是快照之間的相關(guān)性及頁(yè)面權(quán)重如何評(píng)級(jí)?例如sina、souhu、163等權(quán)威網(wǎng)站上有好排名的的超鏈接,那么至少說(shuō)明了該頁(yè)面權(quán)重很高對(duì)吧?假如不但有超鏈接還有錨文本那么相關(guān)性就產(chǎn)生了對(duì)吧?例如這些權(quán)威網(wǎng)站里有我一個(gè)“搜索引擎優(yōu)化”的超鏈接至少能知道我網(wǎng)站的主體思想吧?這就是超鏈分析技術(shù)。超鏈分析算法兩個(gè)核心:一個(gè)是超鏈接的頁(yè)面評(píng)級(jí)判斷;另一個(gè)是錨文本相關(guān)性判斷;這就是李彥宏的超鏈分析專(zhuān)利。

一、搜索引擎超鏈分析算法
超鏈分析專(zhuān)利其實(shí)就是現(xiàn)實(shí)生活中類(lèi)似于鏈接關(guān)系的應(yīng)用。要判斷哪個(gè)頁(yè)面最具權(quán)威性,不能光看頁(yè)面自己怎么說(shuō),還要看其他頁(yè)面怎么評(píng)價(jià)。李彥宏1997年就提交了一份名為“超鏈文件檢索系統(tǒng)和方法”的專(zhuān)利申請(qǐng),這比GOOGLE創(chuàng)始人發(fā)明PR要早得多,不得不說(shuō)這是非常具有前瞻性的研究工作。在這份專(zhuān)利中,李彥宏提出了與傳統(tǒng)信息檢索系統(tǒng)不同的基于鏈接的排名方法。這個(gè)系統(tǒng)除了索引頁(yè)面之外,還建立一個(gè)鏈接詞庫(kù),記錄鏈接錨文字的一些相關(guān)信息,如錨文字中包含哪些關(guān)鍵詞,發(fā)出鏈接的頁(yè)面索引,包含特定錨文字的鏈接總數(shù),包含特定關(guān)鍵詞的鏈接都指向哪些頁(yè)面。詞庫(kù)不僅包含關(guān)鍵詞原型,也包含同一個(gè)詞干的其他衍生關(guān)鍵詞。
根據(jù)這些鏈接數(shù)據(jù),尤其是錨文字,計(jì)算出基于鏈接的文件相關(guān)性。在用戶(hù)搜索時(shí),將得到的基于鏈接的相關(guān)性與基于關(guān)鍵詞匹配的傳統(tǒng)相關(guān)性綜合使用,得到更準(zhǔn)確的排名。
在今天看來(lái),這種基于鏈接的相關(guān)性計(jì)算是搜索引擎的常態(tài),每個(gè)SEO人員都知道。但是在十三四年前,這無(wú)疑是非常創(chuàng)新的概念。當(dāng)然現(xiàn)在的搜索引擎算法對(duì)鏈接的考慮,已經(jīng)不僅僅是錨文字,實(shí)際上要復(fù)雜的多。一個(gè)與根據(jù)超鏈指向的查詢(xún)索引文檔相關(guān),用于檢索文檔的搜索引擎。它的索引器遍歷超文本數(shù)據(jù)庫(kù)并尋找包括超鏈指向的文檔地址與每個(gè)超鏈的錨文本在內(nèi)的超文本信息。超文本信息是貯存在一個(gè)倒排索引文件里,這個(gè)倒排索引文件亦可用于計(jì)算對(duì)于各超鏈指向的特定文檔鏈接向量。輸入查詢(xún)時(shí)候,搜索引擎找到錨文本里含有查詢(xún)?cè)~的全部文檔的向量。此外計(jì)算了查詢(xún)向量,然后算出查詢(xún)向量跟每個(gè)文檔鏈接向量的點(diǎn)積。特定文檔相關(guān)點(diǎn)積的加總確定每一個(gè)文檔的相關(guān)性排名這份專(zhuān)利所有人是李彥宏當(dāng)時(shí)所在的公司,發(fā)明人是李彥宏本人。

 

二、搜索引擎投票排名算法

這個(gè)算法是在超鏈分析技術(shù)之后延伸的一個(gè)投票記錄算法,搜索引擎排序規(guī)則需要在搜索展現(xiàn)與訪問(wèn)之間做出有效分析、對(duì)比并記錄的.無(wú)論是百度排名還是google等搜索引擎結(jié)果展示并不是很容易判斷關(guān)鍵詞與快照的權(quán)威性,如何判斷關(guān)鍵詞與實(shí)際快照的權(quán)威性呢?一定是從用戶(hù)出發(fā),根據(jù)有效搜索做出判斷,人自然檢索一個(gè)關(guān)鍵詞并訪問(wèn)結(jié)果時(shí),用戶(hù)經(jīng)常會(huì)找不到自己想要的結(jié)果,所以當(dāng)人自然檢索后雖然訪問(wèn)到了您的網(wǎng)站,但不一定是有效搜索,因?yàn)樽詈笏阉鞑灰欢〞?huì)停留到您的網(wǎng)站上,假如:您搜索一個(gè)詞,打開(kāi)第一位結(jié)果,發(fā)現(xiàn)不是你想要的,您肯定會(huì)繼續(xù)訪問(wèn)下面的結(jié)果,直到找到你您需要的結(jié)果后才停止訪問(wèn)剩余結(jié)果(也有可能您根本找不到自己想要的結(jié)果)當(dāng)您找到需要的結(jié)果后自然不會(huì)繼續(xù)訪問(wèn)剩余的結(jié)果,最后停留的目標(biāo)頁(yè)面被稱(chēng)之為有效搜索;雖然這個(gè)思路和算法還存在很多缺陷,但是大部分搜索引擎還是以這個(gè)算法為最佳算法,因?yàn)樗阉饕鏌o(wú)法判斷出來(lái)關(guān)鍵詞與快照的權(quán)威性。只有通過(guò)用戶(hù)訪問(wèn)需求進(jìn)行對(duì)比分析、加以頁(yè)面評(píng)級(jí)增加或減少!

快速提交您的需求


咨詢(xún)類(lèi)型:


您的姓名: *


您的手機(jī): *


咨詢(xún)問(wèn)題:


    

留下您的聯(lián)系信息,我們會(huì)有專(zhuān)業(yè)營(yíng)銷(xiāo)顧問(wèn)與您聯(lián)系,或直接拔打電話 0898-66960731 一對(duì)一為您詳細(xì)介紹相關(guān)產(chǎn)品和服務(wù),幫您更高效的開(kāi)展網(wǎng)絡(luò)營(yíng)銷(xiāo)。