中新網(wǎng)10月23日電 近日,一份百度創(chuàng)始人李彥宏早年間發(fā)表于國際權(quán)威學術(shù)期刊PAMI的論文在國內(nèi)計算機工程師中悄然流傳。據(jù)本報記者調(diào)查顯示,這篇1996年發(fā)表的論文主要聚焦于OCR(光學字識別)模型選擇和集成問題,成文于1993年李彥宏就讀研究生期間。
IEEE PAMI,全稱“IEEE Transactions on Pattern Analysis and Machine Intelligence”,世界計算機視覺和模式識別領(lǐng)域頂尖期刊。在PAMI上發(fā)表論文至今仍被作為博士后選拔的衡量指標。李彥宏能以碩士研究生身份完成這樣“不可能的任務”,讓已經(jīng)習慣了他企業(yè)家身份的人們感到驚訝。
1993年5月,當時還在布法羅大學念研究生的李彥宏進入位于普林斯頓的松下信息技術(shù)研究所兼職實習,期間他涉及了OCR并革新了算法,獲得了研究所的重視,8月底,當李彥宏結(jié)束兼職回校時,松下決定破例繼續(xù)聘用他,并允許他無需上班,可以在學校里做研究。后來的一次國際性學術(shù)會議上,李彥宏發(fā)布了這個研究成果,并在PAMI上發(fā)表這篇題為《光學字符識別圖像缺陷的驗證》的論文。
1994年,李彥宏放棄博士入學資格,進入道瓊斯公司旗下IDD信息服務部門的加里軟件公司工作,并在美國電氣與電子工程師學會的期刊上發(fā)表了名為《關(guān)于定性搜索引擎》的論文,也是在這時,李彥宏發(fā)現(xiàn)“科學論文通過索引被引用次數(shù)的多寡來確定一篇論文的好壞,超鏈就是對頁面的引用?!崩顝┖昊貞洠俺溕系奈淖志褪菍λ溄泳W(wǎng)頁的描述,通過這個描述可以計算出超鏈和頁面之間的相關(guān)度?!币源藶榛A(chǔ),1997年2月李彥宏正式向美國商標局申請了“超鏈分析技術(shù)”專利(Hypertext document retrieval system and method,專利號5,920,859)。這也為他后來放棄美國綠卡、回國創(chuàng)業(yè),建成全球第一大中文搜索引擎——百度奠定了技術(shù)基礎(chǔ)。
1998年,第七屆萬維網(wǎng)大會在澳大利亞布里斯班舉行,當時年僅30歲的李彥宏作為美國最知名的搜索引擎公司之一——Infoseek 的技術(shù)專家應邀在大會做了題為“How to find spam in web search”的演講,而聽眾席上就坐著后來Google的兩位創(chuàng)始人——當時仍在斯坦福就讀的佩奇和布林。二人還在會議間歇向李彥宏請教搜素引擎如何實現(xiàn)商用化的問題。不久之后,Google在美國誕生。而戲劇性的是,佩奇在申請專利時由于Page rank與李彥宏之前申請的超鏈分析專利具有相似性,美國專利商標局直到2001年才獲準了 Page Rank專利申請。這一段軼事,也因為Google傳記《in the plex》一書的披露而為越來越多的人所了解。
十年后,當萬維網(wǎng)之父提姆•博納斯•李在與李彥宏在第十七屆萬維網(wǎng)大會相遇,他告訴李彥宏,自己至今對他在第七屆大會上的演講印象深刻。而在2011年世界計算機大會上,原美國國家科學基金會副主席兼信息學部主任彼得·弗里曼發(fā)布的“計算機發(fā)展史”報告中,李彥宏成為唯一提及的中國學者,與發(fā)明了TCP協(xié)議的羅伯特·卡恩以及開創(chuàng)了智能手機和平板電腦新時代的喬布斯等齊名。在他們心目中,李彥宏除了是百度的引領(lǐng)者之外,更是對業(yè)界產(chǎn)生深遠影響的技術(shù)專家。
今年9月份,李彥宏應邀出席數(shù)據(jù)挖掘領(lǐng)域頂級年會——第18屆ACM SIGKDD大會并發(fā)表演講。時隔多年,他仍將OCR 作為“互聯(lián)網(wǎng)行業(yè)的九大難題”之首,又讓人們仿佛看到了那個在松下實驗室里一鳴驚人的年輕中國學生,十多年來依舊保持著對技術(shù)的熱愛和創(chuàng)新的敏銳。
相關(guān)閱讀