谷歌搜索引擎特色淺析

發(fā)布時(shí)間:2018-08-29 10:38:27   發(fā)布者: ziyu    文章來源: 網(wǎng)絡(luò)

這篇文章,小編來跟大家分享的內(nèi)容是關(guān)于谷歌的搜索特色~

Google的一些特色包括:支持多種搜索語言,種數(shù)達(dá)到了上百種;搜索速度快,據(jù)說Google擁有8000多臺(tái)服務(wù)器,200多條T3級(jí)別的寬帶;Google還擁有專利網(wǎng)頁級(jí)別技術(shù)PageRank,可以提供高命中率的搜索結(jié)果;Google的智能化的“手氣不錯(cuò)”功能,可以提供最符合要求的網(wǎng),谷歌涂鴉是谷歌于節(jié)日和其他紀(jì)念日在主頁上展示的定制版谷歌圖標(biāo),如搜一下日本的:

在這里就不一一列舉了。 

為了做更深入了了解,我們還是先來學(xué)習(xí)一下Google的搜索語法。谷歌的搜索語法分成了兩大類,一類是基本語法,另一類就是高級(jí)語法了。這一次,就先介紹一下Google的基本語法。

基本語法

1)谷歌的默認(rèn)搜索是and邏輯,意思就是,我們?cè)谳斎腙P(guān)鍵字后進(jìn)行搜索時(shí),如輸入:“computer        google”后,會(huì)搜出包含“computer”和“google”的文件內(nèi)容,如圖:

說到這里,給大家插入一個(gè)小知識(shí)點(diǎn):基礎(chǔ)布爾邏輯。 

對(duì)于一個(gè)搜索引擎來說,進(jìn)行搜索的時(shí)候是要搜索和匹配到所有關(guān)鍵詞的頁面,還是包含關(guān)鍵詞中的任意關(guān)鍵詞?,取決于一個(gè)搜索引擎的一些特別算法,稱之為搜索引擎的布爾邏輯默認(rèn)值。而google就是用and作為默認(rèn)邏輯(搜索到所有的關(guān)鍵詞),當(dāng)然這個(gè)前提是我們沒有輸入一些特殊的命令。

2)如果你不確定你要搜索的內(nèi)容,或者你想搜索兩個(gè)中的任意一個(gè),那么就要使用關(guān)鍵詞“OR”。注意:OR是大寫的,小寫是不起作用的,而且,每一個(gè)關(guān)鍵詞與“OR”之間是有一個(gè)空格的,當(dāng)然了,除了“OR”,“|”也是或的意思。我們來看一下搜索結(jié)果。

搜到的結(jié)果是包含computer字樣或Google字樣的頁面。

3)如果我們?cè)谧帜钢g不想插入任何東西,即我就想搜“computerGoogle”那么可以輸入“computerGoogle”【注:字符用雙引號(hào)引起來】:

如上圖所示,結(jié)果中的computerGoogle都是在一起的,沒有分割。當(dāng)然這樣的結(jié)果比較少,只有2940個(gè),但是看圖2,結(jié)果卻有18億多個(gè)。而且,大部分搜索引擎都有智能斷句的功能,如果沒有特殊的命令,搜索引擎會(huì)一定量的根據(jù)大眾的語言使用習(xí)慣來判斷你要搜索什么,而這樣的做法,不僅僅沒有使搜索引擎顯得不聽話,反而對(duì)大眾來講搜索引擎變得十分智能和高效!

4)如果我們只想顯示computer,而不想看到Google,那么我們看可以這樣輸入:在computer后面加一個(gè)空格,然后減號(hào)“-”Google,即:computer -Google:

5)一般來說,當(dāng)輸入關(guān)鍵詞后,google會(huì)把相關(guān)網(wǎng)頁和信息的結(jié)果呈現(xiàn)在我們面前。然而,有一些單詞在搜索引擎中是會(huì)被智能忽略的,導(dǎo)致我們得不到想要的結(jié)果。比如十分常用的“www”和“the”,基本上任何一個(gè)網(wǎng)頁上都會(huì)找到的東西,就會(huì)被google自動(dòng)忽略(不要覺得這樣不好,還是那個(gè)道理,在實(shí)際引用當(dāng)中這樣做反而顯得更加高效和智能)。如果我們不想忽略這些詞進(jìn)行查詢,就得在這些關(guān)鍵詞的前面加上符號(hào)“+”。如下圖:

這樣就很明顯,如果過濾掉www,那么相當(dāng)于谷歌只搜索字樣“Google”,所以搜到的信息遠(yuǎn)遠(yuǎn)比加上“www”要豐富的多。

高級(jí)語法

1)intitle

首先要介紹的就是“intitle:”的用法,這個(gè)串的作用是將搜索的范圍局限在標(biāo)題上。在關(guān)鍵詞前面加上這個(gè),就會(huì)只對(duì)網(wǎng)頁的標(biāo)題進(jìn)行搜索并且配對(duì),最后將結(jié)果返回給用戶。例如輸入“intitle YouTube computer”進(jìn)行搜索,就會(huì)返回如下圖所示:

但是可以看到,貌似搜索結(jié)果中只出現(xiàn)了關(guān)于YouTube的內(nèi)容,而computer相關(guān)的內(nèi)容很少,這里其實(shí)還是牽扯到搜索引擎的基礎(chǔ)布爾邏輯問題,在intitle:語法上,google會(huì)檢索所有的網(wǎng)頁,只要出現(xiàn)YouTube或者computer其中的一個(gè)就會(huì)被匹配,意料之中的是,關(guān)于YouTube的內(nèi)容肯定是要遠(yuǎn)遠(yuǎn)多于computer的內(nèi)容,所以搜索結(jié)果里關(guān)于YouTube的內(nèi)容占據(jù)了主導(dǎo),但是如果我們想要找到網(wǎng)頁標(biāo)題中既有YouTube又有computer的網(wǎng)頁,我們就要使用“intitle:”的一個(gè)變體“allintitle:”,使用這個(gè)前綴后,就能得到我們想要的結(jié)果了。如下圖所示:

2)intext

看到這個(gè)單詞,大概就可以猜到它的意義了,“intext:”是用來搜索網(wǎng)頁正文內(nèi)容的,這樣就可以忽略網(wǎng)頁中的超文本鏈接、URL和題目。我們輸入“intext:2018 tjut”進(jìn)行搜索,結(jié)果如下圖所示,結(jié)果中顯示的網(wǎng)頁大部分標(biāo)題幾乎沒有規(guī)律,但是網(wǎng)頁的索引中都包含著 “2020 tjut”,但是因?yàn)?020和tjut的同時(shí)出現(xiàn)的網(wǎng)頁實(shí)在比較少,兩個(gè)關(guān)鍵詞的關(guān)聯(lián)度實(shí)在不高,因?yàn)楝F(xiàn)在才是2018年,如果換成“2018 tjut”我相信應(yīng)該會(huì)有更多的結(jié)果出現(xiàn)。但是我們要明白,這時(shí)搜索引擎關(guān)注的內(nèi)容是網(wǎng)頁的正文。與之相對(duì)應(yīng)的也有一個(gè)變體:“allintext:”,用法和上面的“allintitle”相似,這里就不做過多的介紹了。

3)inanchor(錨mao點(diǎn))

這個(gè)語法的意思是在頁面的鏈接錨點(diǎn)進(jìn)行搜索。 

鏈接錨點(diǎn)指的是一個(gè)鏈接的描述文本,如這樣的一段HTML代碼:

<a href=https://www.baidu.com>百度</a>,鏈接的錨點(diǎn)就是“百度”了。

我們搜索“inanchor:YouTubeFacebook”就可以搜索到有那些含有錨點(diǎn)的網(wǎng)頁了,如下圖所示。當(dāng)然,這個(gè)語法也有一個(gè)變體“allinanchor:”,意思也與前面的類似。

4)site

這個(gè)語法是把搜索限制在站點(diǎn)域名之內(nèi)。例如我們搜索“site:google.com”,結(jié)果如下圖所示,這里我們通常不需要加上前面的www,這樣搜索的結(jié)果就會(huì)是包括所有含有g(shù)oogle.com域名的有關(guān)內(nèi)容,包括頂級(jí)域名和二級(jí)域名甚至三級(jí)域名的內(nèi)容。也就是說我們甚至可以通過搜索,確定google.com大概有多少個(gè)子域名!

5)inurl

inurl:會(huì)將搜索的范圍限制在URL或者網(wǎng)站的頁面上,這個(gè)語法對(duì)于查找搜索和幫助是很有用的,不僅適合我們普通的搜索,在黑客搜索中用處也很大。例如我們輸入“inurl:password”,結(jié)果如下圖所示,結(jié)果顯示了所有URL中含有password的網(wǎng)頁。另外,這個(gè)語法也有一個(gè)變體:“allinurl:”,用法與前面的相似。

注:“site:google.com –inurl:www.google.com”的意義【查詢谷歌有多少個(gè)子域名】

6)link

這個(gè)的功能是查詢所有鏈接到某個(gè)特定URL上的列表。要注意的是,是特定的URL頁面,如輸入:“link:www.baidu.com”進(jìn)行搜索,如下圖所示,就會(huì)返回所有鏈接到百度主頁的網(wǎng)頁了。因此,我們同樣可以指定特定的URL頁面來進(jìn)行搜索。

7)cache

Cache可以幫助我們查找到google索引過的頁面副本,它最大的好處就是及時(shí)源文件界面不存在了,或者變成了其它的內(nèi)容,我們依然可以搜索的到。例如輸入:“cache:www.baidu.com”,結(jié)果如下所示,可以看到,格式雖然亂糟糟的,但是依稀可以從中獲取一些有用的信息的。在國(guó)內(nèi)的搜索引擎上,可能也有類似的功能,比如百度的網(wǎng)頁快照,其功能與這個(gè)類似。

8)filetype

filetype是指搜索指定后綴的文件。這個(gè)不太常用,但是在黑客領(lǐng)域有一定的作用。但是我們的重點(diǎn)是講解語法,如下圖所示,輸入“filetype:mdb”,結(jié)果就會(huì)顯示出一些網(wǎng)站的數(shù)據(jù)庫(kù)文件。

9)related

這個(gè)語法是用于搜索語某些頁面相關(guān)的網(wǎng)站的,可以輔助我們搜索同類的頁面。比如我們輸入“related:www.google.com”,顯示的結(jié)果都是一些其他的搜索引擎。

10)info

這個(gè)語法可以搜索到關(guān)于一個(gè)URL的更多信息的頁面列表,這里的信息包括這個(gè)網(wǎng)頁的cache,還有與這個(gè)網(wǎng)頁相似的網(wǎng)頁等等,注意下面的英文信息就好。輸入“info:www.baidu.com”,結(jié)果如下圖所示。



推薦了解
Google推廣
Google推廣介紹

google是全球最大的搜索引擎,用戶覆蓋全球70%以上的國(guó)家,通過谷歌的關(guān)鍵字廣告,可以輕松將企業(yè)產(chǎn)品向全球用戶推廣,google推廣是企業(yè)進(jìn)行海外營(yíng)銷、外貿(mào)推廣的好幫手。

QQ咨詢
在線咨詢
咨詢熱線
關(guān)注微信
TOP