分析:人名搜索Spock會成下個谷歌嗎
有哪一家網絡新秀Web 2.0公司不希望自己成為下一個Google公司呢?后起新秀Google公司能夠超過雅虎公司,那為什么就沒有另外一家公司能夠去“分享Google公司的午餐”?盡管Spock公司中還沒有人大膽地這樣聲稱,但這一針對人名搜索的服務于今天上午上線了。
在發布時,Spock公司的數據庫中將包含1億多人,而且它計劃通過搜索時急速走遍其它可以公開訪問的站點迅速地增加更多的人。盡管諸如Wink、ZoomInfo.com、Linkedin等與人相關的搜索站點沒有能夠改變搜索市場的格局,但Spock公司采取了不同的策略,提供了元數據搜索,向可信賴的用戶提供類似于Wikipedia的標注權限。
據CNET News.com在最近采訪Spock公司的CEO、合伙創始人Jaideep Singh時發現更多。當被被問到Spock公司目前已經索引了多少人時,Jaideep Singh表示:有1億多一點。當被問到公司每天大約增加多少用戶時,他表示增加的有二類內容:一種是人,另一種是處理的文檔數量,因為一個人可能有多個文檔,因此我們在對整個Web進行快速遍歷時挑選文檔,根據人組織文檔。
當Jaideep Singh被問到他是否能夠準確地解釋這一技術的工作原理時回答:如果要對一些具體關鍵字進行搜索,Google公司的表現是相當不錯的。然而問題是:如果目前在Google上搜索人,用戶獲得的將是許多與所查的人相關的文檔。如果要搜索的人有“David Stern”這樣大眾化的名字,那么搜索結果中的前幾頁的內容可能與名為“David Stern”的NBA委員相關,因此,我們無法搜索到在酒吧或商業會議上遇見的“David Stern”。據他表示,這一技術與通用搜索相比要困難得多,這是一種不同的技術,它們之間唯一的相同點是遍歷。當進行遍歷時,我們采取的是一種不同的方法。我們不僅僅是抽取元數據,而且還試圖找出文檔與誰相關。我們希望找到文檔中相關性最高的內容。我們首先必須理解語言,理解文檔的內容,開發自然語言處理和其它技術等。
據Jaideep Singh表示,人們應該意識到我們與Google公司的相同點在于對Web的索引。我們將從公開文檔中獲取內容。而且人們也要意識到,在互聯網上有許多與我們自己的諸如博客、MySpace檔案等相關的資料。我們的β版服務已經運行兩個月了,我們擁有了大量的用戶,用戶的反饋也非常好,人們將會發現它很有用,而且也是很有趣的。
|