中國網(wǎng)民瀏覽習(xí)慣與眾不同
新浪科技:因?yàn)槭侨蚧a(chǎn)品,您比較熟悉中國團(tuán)隊(duì)的事情,中國團(tuán)隊(duì)我們會(huì)做些什么事情,對(duì)Google廣告系統(tǒng)的支持?
郄小虎:我們團(tuán)隊(duì)和Google廣告進(jìn)行平臺(tái)開發(fā)的,我們開發(fā)的是同一個(gè)系統(tǒng),不管中國客戶美國客戶,他使用的系統(tǒng)是同一個(gè)系統(tǒng),我們是上千、上萬人開發(fā)系統(tǒng),而不是幾十人幾百人,我們站在巨人的肩上,我們享受前面天才工程師搭建的系統(tǒng)。
中國的團(tuán)隊(duì)對(duì)中國市場(chǎng)有更深的了解,他們經(jīng)常看到中國用戶的特殊需求。我們會(huì)在進(jìn)行核心系統(tǒng)系統(tǒng)開發(fā)之外,把這些用戶的需求反饋到我們?nèi)驁F(tuán)隊(duì),我們會(huì)把這些功能實(shí)現(xiàn)出來。
我可以舉一個(gè)例子,在世界上大多數(shù)國家,當(dāng)用戶瀏覽一個(gè)頁面的時(shí)候,他們的注意力會(huì)集中在頁面的某些區(qū)域,這個(gè)區(qū)域大概呈現(xiàn)出英文字母的“F”型,主要在頁面最上面和最左邊,這些是頁面關(guān)注度很高的區(qū)域。
我們發(fā)現(xiàn)中國用戶瀏覽習(xí)慣不一樣,他們關(guān)注焦點(diǎn)是均勻分布在頁面所有位置,他們哪兒都看。因?yàn)橛捎陧撁嬖O(shè)計(jì)的特點(diǎn),用戶會(huì)跳過頁面上面的位置,頁面上面經(jīng)常出現(xiàn)不太相關(guān)的細(xì)節(jié)他們經(jīng)常跳過,到頁面的后半部,發(fā)現(xiàn)這個(gè)用戶行為之后,我們對(duì)系統(tǒng)做了調(diào)整。我們意識(shí)到作為這樣的產(chǎn)品,如果我們只關(guān)注頁面的上部和左部是不夠的對(duì)中國的用戶來講,我們對(duì)頁面的底部加入大量的信息,對(duì)于關(guān)鍵字的建議等等。這是中國團(tuán)隊(duì)為全球廣告團(tuán)隊(duì)作出貢獻(xiàn)的例子,這不僅讓中國廣告系統(tǒng)收益,發(fā)現(xiàn)其他國家用戶也有這樣的瀏覽習(xí)慣。
新浪科技:您說的工程師是全球部署的是嗎?各個(gè)不同的地方的改動(dòng),都會(huì)影響產(chǎn)品的形態(tài)是嗎?
郄小虎:是。我們是在同一個(gè)系統(tǒng)上進(jìn)行開發(fā),可以開發(fā)出針對(duì)每個(gè)國家地區(qū)的用戶需要的特殊功能,針對(duì)這個(gè)功能,可以只對(duì)這個(gè)國家用戶開放。在不適用的國家,會(huì)把這個(gè)功能關(guān)掉是可以選擇的。
Google廣告核心系統(tǒng):海量存儲(chǔ)、機(jī)器學(xué)習(xí)、實(shí)時(shí)匹配
新浪科技:剛才tiger給我們講了工程師在做Google廣告系統(tǒng)的時(shí)候,會(huì)面臨的一些問題,我們想了解工程師在技術(shù)上面,會(huì)面臨什么樣,除了之前說的資金壓力,他們?cè)诩夹g(shù)上會(huì)面臨什么樣的問題呢?
郄小虎:廣告系統(tǒng)是非常大型的分布式系統(tǒng),對(duì)完成每一次用戶請(qǐng)求這個(gè)過程并不復(fù)雜,我們想象需要一個(gè)數(shù)據(jù)庫存儲(chǔ)所有廣告信息,需要一個(gè)截面給廣告商使用,他們通過頁面他們購買的關(guān)鍵字,對(duì)于每一個(gè)關(guān)鍵字的售價(jià)和廣告信息等。數(shù)字信息會(huì)被傳到全球所有瀏覽器上去,用戶在搜索時(shí),會(huì)提供給相應(yīng)匹配的廣告信息展示給用戶,會(huì)被回傳下來,用戶月底會(huì)收到帳單。
對(duì)Google最大的挑戰(zhàn)是,我們?nèi)绾蜗鄳?yīng)海量的廣告商數(shù)據(jù)、用戶數(shù)據(jù),每天超過十億的客戶訪問量。每一次的用戶請(qǐng)求,要進(jìn)行非常復(fù)雜的競(jìng)拍過程,這里需要牽涉到上千臺(tái)機(jī)器的協(xié)同工作。
相比其它部來說,搜索來講,廣告系統(tǒng)對(duì)搜索同步性非常高。如果搜索一個(gè)網(wǎng)站,網(wǎng)站會(huì)進(jìn)行更新如果我經(jīng)過一段延遲看到廣告最新的內(nèi)容,大家都是可以接受的。對(duì)于廣告平臺(tái)上的應(yīng)用來講,廣告商他們經(jīng)常會(huì)把一個(gè)新的廣告上線,或把已有的廣告下線他們會(huì)買新的關(guān)鍵字和進(jìn)行調(diào)整,這些改動(dòng)需要在新的時(shí)間內(nèi)生效。
新浪科技:您能給我們總結(jié)出什么樣的機(jī)制,在支撐Google的正常運(yùn)轉(zhuǎn)嗎?
郄小虎:這個(gè)系統(tǒng)簡(jiǎn)單分成三大模塊,首先要海量存儲(chǔ)系統(tǒng),這個(gè)系統(tǒng)需要存儲(chǔ)所有用戶廣告商的廣告數(shù)據(jù),包括關(guān)鍵字、出價(jià)、預(yù)算、廣告創(chuàng)意。同時(shí)它要記錄所有的用戶行為,包括每一次廣告展示,每一次廣告的點(diǎn)擊、轉(zhuǎn)換等等。
對(duì)于這個(gè)數(shù)據(jù)庫來講,它需要處理大量的海量數(shù)據(jù),我們的系統(tǒng)中現(xiàn)在有超過上百萬的廣告客戶,如果你假設(shè)每一個(gè)廣告客戶購買一千個(gè)關(guān)鍵字?jǐn)?shù)據(jù)量是相當(dāng)大的。
經(jīng)常我們的系統(tǒng)需要完成一些我們的分析工作,比如說我們想知道最多的關(guān)鍵字是哪一個(gè),或者說這段時(shí)間內(nèi)用戶搜索的關(guān)鍵字是哪些,這些請(qǐng)求是傳統(tǒng)數(shù)據(jù)庫不能完成的,是由我們工程師開發(fā)的超大容量的數(shù)據(jù)庫進(jìn)行支持。
第二個(gè)模塊是機(jī)器學(xué)習(xí)系統(tǒng)。這個(gè)系統(tǒng)對(duì)我們記錄下來的所有事件分類、分析、處理。比如我們對(duì)廣告和一個(gè)關(guān)鍵字的相關(guān)性進(jìn)行處理,我們會(huì)對(duì)一個(gè)頁面上面的概念進(jìn)行抽取,我們會(huì)對(duì)用戶的點(diǎn)擊,以及轉(zhuǎn)換機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)系統(tǒng)會(huì)建立非常大數(shù)學(xué)模型,這是支持我們廣告質(zhì)量的分的核心系統(tǒng)。
最后一個(gè)是實(shí)時(shí)匹配系統(tǒng),這個(gè)系統(tǒng)完成了我們競(jìng)拍過程,每一個(gè)客戶請(qǐng)求到來之后,我們會(huì)從機(jī)器系統(tǒng)中找到可以匹配的廣告,從當(dāng)中提取的模型對(duì)請(qǐng)求進(jìn)行預(yù)算,對(duì)每個(gè)廣告進(jìn)行評(píng)分,最終完成競(jìng)拍的過程,把排名前面的廣告展示在前面。 本新聞共 5頁,當(dāng)前在第 4頁 1 2 3 4 5
想認(rèn)識(shí)全國各地的創(chuàng)業(yè)者、創(chuàng)業(yè)專家,快來加入“中國創(chuàng)業(yè)圈”
|