|
||||
2003年8月,中國的互聯網市場一夜之間出現了戲劇性的變化:新浪、搜狐、網易、263等知名門戶網站全部改換成慧聰搜索引擎。而所有這些的背後,和一個叫陳沛的人密切相關。正是他在檢索技術上近十年的奮斗,纔能帶領慧聰搜索一舉奪得中文智能搜索的大半江山。
這是一個怎樣奇特的人?
將人工智能應用到搜索技術上
大學畢業,陳沛進入軍隊開始從事大型計算機信息處理工作,上世紀80年代初介入了人工智能。他是參加人工智能的第一人,在人工智能領域裡做出了特殊貢獻,其間獲全軍科技成果二等獎兩次、三等獎三次。1987年,他在北大和中科院學習人工智能化課程的研究生課程,那個時候他還穿軍裝,但是那個時候的經歷對他後來的影響非常大。他對人工智能的把握,甚至促使他自己寫了一個五子棋的程序。這種博弈程序,最接近人類的思維過程,直接模擬大腦思維,後來將人工智能結合了搜索引擎。
1994年,陳沛開始進入中國的中文的全文檢索技術,發明了全文檢索技術和數據庫無縫對接技術,第一個合作伙伴是IBM,在DB2上面開發;第一個用戶是新華社,第二個用戶是《北京日報》。1994年互聯網還沒有全面普及,所以他做的是企業級的搜索服務,在中國叫做『全文檢索』。實際上核心技術就是現在的搜索技術。
那個時候他一直在做全文檢索系統,主要是企業級的,涉及中文自動分類、自動摘要等很多中文技術的研究。代表作品就是I-search,全中文檢索系統,曾經是最著名的企業搜索引擎產品,它被廣泛使用在新華社,結果其他單位的人看到後都向他們要,後來都成為了I-search用戶,包括《計算機世界》、聯想集團。到1995年,陳沛又第一個推出了智能化的全文檢索系統,在國內第一個把人工智能結合到搜索技術裡面。
再後來,開發了『網神』。再後來,推出了『中國搜索聯盟』和『慧聰搜索』。
陳沛眼裡的『後門戶時代』和『第三代中文智能搜索引擎』
第三屆亞太傳媒會議上,陳沛提出來了他對互聯網包括信息服務的看法,第一次提出了『後門戶時代』的理念,他認為最重要的特征是:門戶時代使用者主動尋找信息,而後門戶時代信息將被推送給需要者。
目前絕大多數的網站只是把互聯網當做新的信息載體,而互聯網作為第四媒體的特點並未充分體現,因而停留在較低的網絡服務水平上。如果說門戶時代的標志性技術是搜索引擎,可以有效地幫人們尋找Internet信息;那麼,後門戶時代的信息技術,主要是基於Internet駕馭信息。目前95%以上的網站都存在同樣的缺陷:內容放在Web服務器上,用戶必須訪問Web界面纔能享受到它的內容和服務。如果僅僅是這樣,作為一個新的傳播方式,除了換了一個傳播介質,它和傳統媒體還有什麼區別呢?所以,未來幾年內,互聯網優勢將被發揚光大,表現出更多與傳統媒體不同的特點。所以稱為在Internet上駕馭信息。在互聯網高速發展的今天,人們有理由追求更好的互聯網服務模式,讓信息來找我們。以客戶為中心的網絡服務方式將取代以Web為中心的服務方式,後門戶時代的信息技術與服務將徹底改變人們從Internet上獲取信息的方式和理念。
隨後,陳沛又提出了革命性的『第三代中文智能搜索』。陳沛認為:第一代搜索引擎技術是開創性的革命,第二代搜索引擎技術是開拓性的革命,而他開發的『第三代中文智能搜索引擎技術』是『回歸性的革命』和第一代的yahoo和第二代的google相比,第三代的中文搜索技術更注重智能化和用戶使用的個性化。所以說,智能化搜索是未來引擎搜索的發展方向的說法是很必然的。對於包括google、百度在內的第二代搜索引擎來說,依然不足以滿足人們在搜索過程中的智能化和個性化的需求。
那麼智能搜索表現為什麼呢?簡單地說,用戶通過最簡單的輸入,能夠拿到最適合的結果。所以需要用智能化來有效提高搜索的服務品質和質量。在技術上第三代智能搜索技術采用了新的算法和技術。
輕松面對搜索引擎的市場博弈
目前,海外搜索市場每年為搜索廠商帶來約20億美元的收入,而這一數字在國內被預測為,3到5年後將變成70億美元的大市場。這個龐大的市場也將吸引國外一批搜索巨頭再度進入。
一個月前,在陳沛的努力下,慧聰搜索引擎一舉在新浪、搜狐、網易、263等門戶網站全面獲得應用。此番搜索廠商對於門戶網站的爭奪非常激烈,百度和慧聰對此都在積極地爭取。最後的結果使國內的搜索市場格局一下子變了模樣。有專業人士分析說,四大門戶同時簽約慧聰,將為其帶來每天數千萬計的搜索流量,這也在一定程度上迅速拉動慧聰搜索的發展。而慧聰也已取代了百度的地位,成為第一大中文搜索引擎。
陳沛這樣闡述了慧聰第三代智能搜索引擎的技術特點與優勢:該搜索引擎首次將自動分類技術、中文內容分析技術及區域識別技術應用到大型搜索引擎中,其中文網頁覆蓋率已超過2億頁。除了在信息檢索速度、更新頻率等基本技術指標方面處於領先地位外,它的網頁相關檢索、拼音糾錯、模糊查詢、口音查詢技術也具有很高的水准。此外,還同時推出了MP3、圖片、FLASH搜索功能,已成為能夠提供全面、綜合的信息搜索服務的技術提供商。
同時,陳沛自信自己的搜索引擎產品已經全面超越中文GOOGLE。據了解,網民可以登錄www.game.huicong.com參與慧聰第三代智能中文搜索引擎的測評,同時慧聰在網易以及中國搜索聯盟的300多家網站的首頁也設置了測評入口。測評的方式突出了『體驗』的特點,沒有繁瑣的注冊手續,也免去了費時、費力的答題過程,完全尊重網民的自身感受。以兩種模式———專業測評和角色體驗直接將慧聰搜索引擎和GOOGLE進行對比,任由網民自由評價。
陳沛認為,慧聰搜索引擎之所以能成為眾多大型門戶網站的首選,得益於長期以來在中文搜索技術開發方面的不懈努力。慧聰搜索引擎所追求的服務境界已不僅限於滿足用戶『多、快、准』的信息檢索需求,而是『讓搜索更具智慧』,就是不斷提高中文搜索技術的智能化水平,讓搜索引擎更合乎漢語特點和中國人的搜索習慣。具體特點則主要體現在以下幾方面:網頁覆蓋率高、網頁更新頻率快;搜索功能的多樣化,用戶對搜索引擎的使用需求已不是敲幾個關鍵字就能滿足的,而是要求搜索引擎能更好地領悟使用者的搜索意圖,但同時又不能增加搜索的復雜性;具有針對內容的相關性查詢,慧聰搜索引擎的智能化特性最大的體現。在准確地提供您想搜索的內容外,還提供與該內容密切相關的其他信息檢索;符合漢語特性的模糊查詢等特點。
而『中國搜索聯盟』的成立更是陳沛在商業合作策略上的一個創舉。2002年9月25日,由陳沛倡導,慧聰國際和中國互聯網新聞中心在人民大會堂聯合發起成立『中國搜索聯盟』,這是國內第一個以搜索引擎應用為基礎的開放式聯盟,對於推動了搜索引擎技術的發展,普及搜索引擎的應用有著極其重要的作用,並從根本上改變了國內搜索引擎市場的格局。
陳沛對於中國搜索聯盟的發展很有信心,因為他認為這是一件一舉三得的事情,不管是對於聯盟成員、網民及企業都是有好處的。中國搜索聯盟的成立對於聯盟網站來說,將搜索引擎技術應用於這些網站上,使得這些網站能夠擁有與門戶一樣的搜索引擎入口,這對於增加聯盟網站的流量、通過中國搜索聯盟帶動聯盟網站的品牌都有好處,而對於網民來說,聯盟網站統一使用同一個優秀的搜索引擎,使得網民能夠無時無刻體驗最新的搜索引擎技術。這一點陳沛重點強調了一下,搜索引擎原來只是在門戶上使用,而這種應用模式其實是極不正常的,作為互聯網上使用頻率第二的工具,搜索引擎的使用應該更加普及,應該隨時隨地都能被網民使用。而搜索聯盟成立對於企業的意義就在於,中國搜索聯盟正式推出搜索排名服務,形成了一個龐大的也是目前國內最大的跨平臺、跨地域、跨行業的網絡推廣平臺,是企業進行網站推廣的一個最好的選擇。
目前,中國搜索聯盟的模式已經得到很多業界人士的認同,2003年4月,中國搜索聯盟與國內最大的門戶網站新浪網結成戰略合作伙伴,同時,已經有更多的優秀的網站希望能夠加入中國搜索聯盟,短短的一年時間,中國搜索聯盟已經從最初的32家迅速擴展到500多家。
現在,陳沛正領導著200多人的軟件公司,在搜索引擎的市場上也已經佔據了國內的大半江山,成為最大的中文搜索引擎。很少有人能這樣堅定而執著,在10年的時間裡堅持著智能檢索技術這一件事情。也許,這就是陳沛。