當前位置:旅游攻略大全網 - 旅游景点 - 有人能給我們提供搜狐、百度、雅虎的發展歷史嗎?

有人能給我們提供搜狐、百度、雅虎的發展歷史嗎?

百度發展歷史,百度發展歷程

搜索引擎發展史在1990之前,沒有人能搜索到互聯網。

所有搜索引擎的始祖是蒙特利爾麥吉爾大學的艾倫·恩塔奇、彼得·多伊奇和比爾·惠蘭在1990年發明的阿奇·常見問題。雖然那個時候萬維網還沒有出現,但是網絡中的文件傳輸已經相當頻繁了。由於大量文件分散在各個分散的FTP主機中,查詢起來非常不方便,於是Alan Emtage等人想到開發壹個可以通過文件名查找文件的系統,於是Archie應運而生。Archie是第壹個在互聯網上自動索引匿名FTP網站文件的程序,但它不是壹個真正的搜索引擎。Archie是壹個可搜索的FTP文件名列表。用戶必須輸入準確的文件名搜索,然後Archie會告訴用戶哪個FTP地址可以* * *文件。

受Archie受歡迎程度的啟發,內華達系統計算服務大學在1993開發了壹個Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是後來的另壹個地鼠搜索工具。

機器人這個詞對程序員來說有著特殊的含義。電腦機器人是指能以人類達不到的速度重復執行壹項任務的自動化程序。因為專門用於檢索信息的機器人程序像蜘蛛壹樣在網絡上爬行,所以搜索引擎的機器人程序被稱為蜘蛛FAQ程序。世界上第壹個蜘蛛程序,麻省理工學院馬修·格雷分校的萬維網漫遊者,被用來跟蹤互聯網發展的規模。起初,它只是用來統計互聯網上的服務器數量。後來,它被開發用來捕捉網址。

對應漫遊者,1993 10年6月,Martijn Koster創建了阿裏Web (Martijn Koster公告阿裏Web的可用性),相當於HTTP版的Archie。ALIWEB不使用互聯網搜索機器人。如果網站管理員希望自己的網頁被收錄到ALIWEB中,需要提交自己的每個網頁的介紹和索引信息,類似於後來眾所周知的Yahoo。

隨著互聯網的快速發展,檢索所有新的網頁變得越來越困難。因此,基於Wanderer,壹些程序員改進了傳統蜘蛛程序的工作原理。這個想法是,由於所有的網頁可能有鏈接到其他網站,這是有可能的搜索整個互聯網,通過跟蹤所有網頁上的所有鏈接從壹個網站。到了1993年底,壹些基於這個原理的搜索引擎開始陸續出現。三個最著名的是:蘇格蘭的JumpStation,科羅拉多大學的Oliver McBryan的萬維網蠕蟲(McBryan的第壹個指令)和美國國家航空航天局的基於知識庫的軟件工程(RBSE) Spider。JumpStation和WWW Worm只是按照搜索工具在數據庫中找到匹配信息的順序對搜索結果進行排序,根本不存在信息相關性。RBSE是第壹個對Html文件的文本進行索引的搜索引擎,也是第壹個將關鍵詞串匹配度的概念引入搜索結果排名的引擎。

Excite的歷史可以追溯到2月1993。六個斯坦福大學學生的想法是分析單詞關系,以便更有效地搜索互聯網上的大量信息。到了1993中期,這個項目已經是壹個完全投入的項目了,Architext,他們還發布了壹個版本的搜索軟件,供站長們在自己的網站上使用,這個軟件後來被稱為Excite for Web Servers。(註:Excite後來因概念搜索而出名。2002年5月,被Infospace收購的Excite停止了自己的搜索引擎,轉而使用元搜索引擎Dogpile。)

1994 1月,第壹個可搜索可瀏覽的目錄EINet Galaxy(Tradewave Galaxy)上線。除了網站搜索,還支持Gopher和Telnet搜索。

1994年4月,斯坦福大學的兩位博士生楊致遠(楊致遠)和大衛·費羅***,共同創立了雅虎(1996的雅虎)。隨著訪問量和鏈接數的增加,雅虎目錄開始支持簡單的數據庫搜索。因為雅虎!的數據是人工輸入的,所以不能真正歸類為搜索引擎。事實上,它只是壹個可搜索的目錄。漫遊者只抓取URL,但是URL信息的內容太少,單靠URL很難解釋很多信息,搜索效率很低。雅虎!由於網站收錄的網站都附有簡要信息,搜索效率明顯提高。(註:雅虎未來將使用Altavista、Inktomi和Google提供搜索引擎服務。)

1994年初,華盛頓大學計算機系學生布萊恩·平克頓開始了他的小項目“布萊恩·平克頓宣布網絡爬蟲的可用性”。1994年4月20日,WebCrawler僅包含來自6000臺服務器的內容。WebCrawler是互聯網上第壹個支持搜索文檔所有單詞的全文搜索引擎。在它之前,用戶只能通過URL和摘要進行搜索,這些通常來自人工註釋或自動提取文本前100個單詞的程序。(後來webcrawler相繼被AOL和excite收購,現在使用Excite這樣的元搜索引擎Dogpile。)

Lycos(卡內基梅隆大學機器翻譯中心Lycos)是搜索引擎歷史上的另壹個重要進步。卡內基梅隆大學的Michael Mauldin將John Leavitt的蜘蛛程序與其索引程序連接起來,並創建了Lycos。7月20日,1994,數據量54000的Lycos正式發布。除了相關性排名,Lycos還提供前綴匹配和字符相似性限制。Lycos率先在搜索結果中使用網頁自動摘要,最大的優勢是遠遠超過其他搜索引擎的數據量:65438+8月0994-39.4萬篇文檔;1995 1月-1.5萬文檔;1996 11月-超過6000萬文檔。(註:1999年4月,Lycos停止了自己的蜘蛛,轉而由Fast提供搜索引擎服務。)

Infoseek是另壹個重要的搜索引擎。雖然該公司聲稱1994 1成立,但其搜索引擎直到年底才與公眾見面。起初,Infoseek只是壹個默默無聞的搜索引擎,緊隨雅虎之後。而Lycos,沒有什麽獨特的創新。但它的發展歷程和隨後的口碑證明,壹開始第壹個上臺並不總是重要的。Infoseek友好的用戶界面和大量的附加服務(如ups跟蹤、新聞、目錄等)使它越來越出名。6月1995+2月65438與網景公司的戰略協議使其成為壹個強大的搜索引擎:當用戶點擊網景瀏覽器上的搜索按鈕時,Infoseek的搜索服務就會彈出,而Yahoo!提供這項服務。(註:Infoseek後來因其相關性而出名。2001年2月,Infoseek停止了自己的搜索引擎,開始使用Overture搜索結果。)

1995,壹種新形式的搜索引擎出現?元搜索引擎綜述。用戶只需提交壹次搜索請求,元搜索引擎負責轉換處理後提交給多個預選的獨立搜索引擎,獨立搜索引擎返回的所有查詢結果都經過收集處理後返回給用戶。第壹個元搜索引擎是華盛頓大學的碩士生埃裏克·塞爾伯格和柳文歡·埃齊奧尼的Metacrawler。元搜索引擎在概念上聽起來不錯,但是搜索效果總是不盡如人意,所以從來沒有元搜索引擎有過強勢地位。

DEC的altavista(部分網友從2001夏天開始需要通過p-roxy訪問,qbseach搜索AltaVista沒有p-roxy可用,只能顯示搜索結果首頁)是後來者,直到1995 (AltaVista公測新聞稿)才出現。但大量的創新功能使其迅速達到了當時搜索引擎的巔峰。Altavista最突出的優勢是速度(搜索引擎9238:搞笑,altavista是為了展示DEC Alpha芯片強大的計算能力)。

Altavista的其他新功能永遠改變了搜索引擎的定義。

AltaVista是第壹個支持自然語言搜索的搜索引擎,AltaVista是第壹個實現高級搜索語法(如and、OR、NOT等)的搜索引擎。).用戶可以使用AltaVista搜索新聞組並從互聯網上獲取文章,他們還可以在圖片名稱、標題、Java小程序和ActiveX對象中搜索單詞。AltaVista還聲稱是第壹個支持用戶向web索引數據庫提交或刪除URL的搜索引擎,並且它可以在24小時內啟動。AltaVista最有趣的新功能之壹是搜索所有帶有URL鏈接的網站。在面向用戶的界面上,AltaVista也做了很多創新。它將“提示”放在搜索框區域,幫助用戶更好地表達他們的搜索風格。這些提示經常更新,以至於用戶搜索幾次後,會看到很多自己可能永遠不知道的有趣功能。這壹系列功能逐漸被其他搜索引擎廣泛采用。1997年,AltaVista發布了壹個圖形演示系統LiveTopics,幫助用戶從成千上萬的搜索結果中找到自己想要的東西。

然後是HotBot。1995年9月26日,加州伯克利的CS助教Eric Brewer和博士生Paul Gauthier創辦了Inktomi(UC Berkeley announcements Inktomi)。1996年5月20日,Inktomi公司成立,壹個強大的HotBot出現在世人面前。它聲稱每天可以抓取超過65438+1億頁的索引,因此有遠超其他搜索引擎的新內容。HotBot還使用cookie來存儲用戶的個人搜索偏好。(Hotbot是隨後幾年最受歡迎的搜索引擎之壹,被Lycos收購)

Northernlight公司於1995年9月在馬薩諸塞州劍橋成立,1995。8月,1997,Northernlight搜索引擎正式出現。它曾經是數據庫最大的搜索引擎之壹。它沒有停止字。它有極好的時事新聞,壹個由超過7100個出版物組成的特殊收藏,以及壹個很好的高級搜索語法。它是第壹個支持搜索結果簡單自動分類的。(2002年6月5438+10月65438+6月6日,北極光搜索引擎關閉,隨後被divine收購。但在Nlresearch中,選擇了“僅萬維網”,仍可使用Northernlight搜索引擎。)

在1998 10之前,Google只是斯坦福大學的壹個小項目。1995年,博士生拉裏·佩奇開始研究搜索引擎設計,並於9月15日註冊了google.com的域名,1997。1997年底,在謝爾蓋·布林、斯科特·哈桑、艾倫·斯特倫伯格的參與下,BachRub開始提供Demo。1999年2月,Google完成了從Alpha版到Beta版的轉型。谷歌把1998年9月27日當做自己的生日。

Google在整合搜索、多語言支持、用戶界面等功能上的創新,如Pagerank、動態摘要、網頁快照、DailyRefresh、多文檔格式支持、map stock字典搜索等,又壹次像Altavista壹樣永遠改變了搜索引擎的定義。

在2000年年中之前,谷歌因其搜索準確性而備受推崇,但由於其數據庫沒有其他搜索引擎大,缺乏先進的搜索語法,使用價值不是很高,推廣也不快。直到2000年年中數據庫升級,才被雅虎選為搜索引擎。

Fast(Alltheweb)公司成立於1997,是挪威科技大學(NTNU)學術研究的副產品。1999年5月,發布了自己的搜索引擎AllTheWeb。Fast的目標是做全球最大最快的搜索引擎,這幾年已經接近了。Fast(Alltheweb)可以按ODP自動分類網頁,支持Flash和pdf搜索,支持多語言搜索,還提供新聞搜索、圖片搜索、視頻、MP3和FTP搜索,具有極其強大的高級搜索功能。

Teoma源於1998羅格斯大學的壹個項目。Apostolos Gerasoulis教授帶領華裔教授楊韜等人在新澤西皮斯卡塔韋創建了Teoma,於2001年春季首次亮相,2001年9月被Ask Jeeves收購,2002年4月再次發行。Teoma的數據庫仍然很小,但它有兩個輝煌的功能:支持Refine類似於自動分類;同時,還提供了專業鏈接目錄資源。

Wisenut由韓裔尹汝傑創立。2001春季發布測試版,2006 54 38+0 9月5日發布正式版。2002年4月,它被分類目錄提供商looksmart收購。Wisenut還有兩個高明的功能:WiseGuide包含相似的自動分類和相關的搜索詞;預覽搜索結果。

Gigablast由前Infoseek工程師Matt Wells創立。2002年3月顯示pre-Beta版,2002年7月21日發布Beta版。Gigablast的數據庫目前還很小,但也提供網頁快照。壹個特殊的功能是實時索引網頁,妳的網頁壹提交就能被搜索到(註:垃圾郵件發送者的肉包子功能暫時關閉)。

Openfind成立於1998 65438+10月,其技術源於臺灣中正大學吳生教授領導的GAIS實驗室。起初,Openfind只是壹個中文搜索引擎。曾經是最好的中文搜索引擎。巔峰時期為新浪、奇摩、雅虎三大著名門戶網站提供中文搜索引擎,但2000年後市場逐漸被百度、谷歌瓜分。2002年6月,Openfind基於GAIS30項目重新發布了Openfind搜索引擎的測試版,推出了PolyRankTM,並宣布已經積累了35億網頁,開始進軍英文搜索領域。此後,技術升級明顯加快。

北大天網是九五國家重點科技項目“中英文中文編碼與分布式信息發現”的研究成果。由北京大學計算機系網絡與分布式系統研究室開發,於6月29日在CERNET上正式提供服務,1997。2000年初,新的天網搜索引擎研究組成立,由國家973重點基礎研究發展規劃項目基金資助開發,收錄網頁約6000萬。利用教育網的優勢,擁有強大的ftp搜索功能。

百度5438年6月+2000年10月,Hyperchain Analysis的專利發明人、原Infoseek高級工程師李彥宏和他的朋友徐勇(加州伯克利博士)在北京中關村創立了百度公司。Baidu.com搜索引擎測試版於2001年8月發布(百度僅提供搜狐、新浪、Tom等其他門戶的搜索引擎),百度搜索引擎於2001年10月22日正式發布。百度雖然只提供中文搜索,但目前包含了9000多萬個中文網頁,可能是最大的中文數據庫。百度搜索引擎的其他功能還包括:網頁快照、網頁預覽/所有網頁預覽、相關搜索詞、錯別字糾正提示、新聞搜索、Flash搜索和信息快車搜索。2002年3月Blitzen項目啟動後,技術升級明顯加快。

百度:中國版谷歌神話還能走多遠?

8月5日,中國搜索引擎公司百度在納斯達克上市,發行價為27美元。盤中壹度突破150美元,最終收於122.54美元,漲幅353.85%。百度的出色表現使其成為在美國上市的外國公司中上市首日表現最好的股票。

百度上市首日表現強勁主要有兩個原因:

首先是谷歌的示範效應。投資者經常將百度與谷歌相提並論,認為該公司是中國版的谷歌。有分析認為,百度如此受追捧,是因為它結合了中國和搜索。

全球最大的搜索服務提供商谷歌的上市價格也不到100美元,但自上市壹年以來,其股價已超過300美元,表明搜索市場潛力巨大。隨著互聯網在中國的迅速普及,網民數量迅速擴大,中國市場的廣闊性得到了外國投資者的普遍青睞。

其次,中國概念股的魅力。中國已經是世界上最大的計算機市場,並且擁有世界上第二多的互聯網用戶。中國網民數量已超過6543.8億。百度在這個市場占有很大份額。再加上人民幣升值,國外投資者普遍看好中國和搜索市場,所以百度會受到投資者的青睞。

回顧百度的發展歷史,公司和盛大類似,也是抓住了互聯網行業快速發展的機遇,找到了適合自己快速發展的道路。

百度於1999年底創立於美國矽谷。其創始人、百度公司總裁李彥宏是信息檢索技術資深專家,超鏈接分析專利唯壹持有人。

百度成立之初,選擇了與其他專業搜索引擎略有不同的商業模式:即與門戶網站合作,百度對搜索訪問量進行分成。這種付費模式在當時相當受門戶網站歡迎,包括新浪、網易在內的各大門戶網站都采用了百度提供的服務。

但是這種模式很快顯示出它的局限性。門戶網站數量有限,決定了需求有限。2001年初,李彥宏借用了Overtu r e的“付費排名”搜索引擎商業模式。客戶通過購買關鍵詞和競價來決定自己在搜索結果中的排名,並通過上下文內容分析技術在其他頂級搜索引擎上同時投放廣告,與這些合作夥伴分享利益。從2002年到2003年,競價排名迅速成為百度收入的主要來源。2004年,百度80%的收入來自競價排名。

目前,百度是中國訪問量第二、全球第六的網站。數據顯示,中國互聯網用戶48%的搜索請求是通過百度完成的,因此百度被譽為全球最大的中文搜索引擎。根據艾瑞咨詢的數據,2004年中國搜索引擎行業市場規模為654.38+0.25億元,其中搜索引擎運營商收入為6.35億元,渠道代理商收入為6.2億元,百度占據了中國搜索引擎運營商28%的市場份額。獨特商業模式的成功使百度迅速成為中文搜索引擎的領導者。

由於中文的復雜性,百度的搜索技術非常復雜,該公司開發了專門的語言處理技術來處理類似的搜索結果。截至目前,百度已經鏈接了6.9億個頁面,8000萬張圖片,10萬個媒體文件。還包括新聞、貼吧等內容。

擔心市盈率對於百度來說,上市首日的優異表現是壹個好的開始。但“好的開始是成功的壹半”,海外資本市場並不順利。從新浪、網易等先行者身上可以發現,他們的股價表現是有很多先例的。以網易為例,2001達到了0.51美元的最低價。資本殘酷的逐利本性決定了壹家公司壹旦達不到華爾街的預期,股價暴跌是極其正常的。

百度上市首日的優異表現和股價的快速上漲,已經讓市盈率迅速脫離了市場平均水平。這成為未來股價表現的隱憂。壹旦公司增長跟不上市場預期,可能會導致股價水平快速下跌。

百度2004年利潤1200萬元,收入1.11億元。2003年虧損890萬元。2005年壹季度利潤暴漲140%,達到250萬元。根據百度在招股書中公布的財務數據,百度股票發行價市盈率達到540倍,周五收盤價市盈率達到2450.8倍,相當驚人。作為對比數據,谷歌8月6日的市盈率為85.66倍。納斯達克上市的其他兄弟網絡概念股市盈率基本在30-50倍之間。即使百度仍然保持原來200%以上的業績增長,其目前的股價仍然被高估。

另外,百度在搜索領域也不是無敵的。谷歌窺探中國市場已久,眾所周知它盯上了百度。目前谷歌持有百度2.6%的股份,進入中國市場會選擇合並或獨立發展。後續發展將影響百度的市場表現。雖然中文搜索的復雜性和本土文化的適應性使得外資很難占領中國市場,但其資本實力和品牌優勢不容小覷。

至於百度的重要利潤來源,“競價排名”也受到了質疑。這種以競價排名來決定搜索排名的商業模式,不利於搜索引擎的公正性和客觀性。信息幹擾的出現會降低網民對搜索的依賴。百度目前的MP3、圖片和* * *搜索等服務也面臨版權的法律糾紛。雖然不足以影響百度的大局,但還是給百度其他商業模式的推廣帶來了壹定的阻礙。