百度為何開[Kai]源深度機器學習平台?-公司新聞-惠州[Zhou]市合力电(Dian)子有限公(Gong)司
新聞資訊
公司新聞

網(Wang)站首頁[Ye] > 公司新聞[Wen]

百度(Du)為何開[Kai]源深度機器[Qi]學習平台[Tai]?

5月20日,百度在github上開源了其(Qi)深度機器學習平台。此番發布的深度機器學習開源平台屬于“深盟”的開源組織[Zhi],其核心開發者來自百度深度學習研究[Jiu]院(IDL),微軟亞洲研究院(Yuan)、華盛頓大學、紐約大學、香港科(Ke)技大學,卡耐基·梅隴(Long)大學等知[Zhi]名[Ming]公司和高校。

通過[Guo]這一開源平台,世(Shi)界各地的開發(Fa)者們可(Ke)以免費獲得更優質和更容易(Yi)使用的分布式機器學習(Xi)算法[Fa]源碼,從[Cong]而大幅降低(Di)開[Kai]發和部署分布式[Shi]機器(Qi)學習系統及(Ji)相[Xiang]關應用的門檻[Kan]。包括今(Jin)日頭條、汽車之家等在内的[De]多家公司已經通過該開[Kai]放平台受[Shou]益。

作(Zuo)為在人工智能布局較早的玩(Wan)家,百度擁有領[Ling]先[Xian]業界的實力(Li)。從2013年百度(Du)深度學習研[Yan]究院(IDL)的創建及2014年(Nian)Andrew Ng的加盟至今,百度DMLC分[Fen]布式深度(Du)機器學習開源項目(簡[Jian]稱“深盟”)已在深度學習的多個應用領域做(Zuo)過探索,上線了(Le)如xgboost(速度快效果好的Boosting模型)、CXXNET(極緻的C++深(Shen)度學習庫)、Minerva(高效靈活的并(Bing)行深度學習[Xi]引(Yin)擎)以及Parameter Server(一[Yi]小時訓練600T數據)等産品,在語音識(Shi)别[Bie]、OCR識别、人臉識别以及計算效率提升上發布了多個成熟産品。

而具有(You)一系列領先(Xian)優勢[Shi]的百(Bai)度卻選擇[Ze]開源其深度機器學(Xue)習平台,為何交(Jiao)底自(Zi)己的核心技[Ji]術?

深思之下[Xia],卻是在(Zai)面對(Dui)業界無奈時[Shi]的遠見之舉。

擁抱世界:開源的魅力

開源,顧名思義,就[Jiu]是開放自[Zi]己的源代碼給别人查閱和使用,盡管(Guan)看起來很傻,然而諸多曆史事實卻告[Gao]訴我們擁抱世界也能讓[Rang]世界擁(Yong)抱你。

Android的逆襲就(Jiu)是明證,在iOS侵占絕大多數[Shu]智能手機操作系統的時代[Dai]誕生,Google選擇開[Kai]源,讓早已在(Zai)蘋果面前沒[Mei]有機會的業界見到了[Le]希望,至今Android已[Yi]擁有過半[Ban]的市場份額,以至(Zhi)于在移動互[Hu]聯網大行其道的(De)今天,Google可以憑[Ping]借它與旗[Qi]下産品的整合打造屬于自己[Ji]的強[Qiang]大生态系統。相比之下,生而嬌(Jiao)貴的Windows mobile的(De)故事夠令(Ling)人[Ren]發醒的,終(Zhong)于(Yu)微[Wei]軟也不得不寄人籬(Li)下地去兼容Android和iOS平台(Tai)應用。此(Ci)外,作為微軟(Ruan)最主要的應用程序(Xu)框架[Jia],微軟對.net寄予厚望,希[Xi]望它的開源可(Ke)以(Yi)來到所有平台,進而重[Zhong]現JAVA的光輝曆史[Shi]。這也證明了即[Ji]使強大如微軟(Ruan)也無法憑借一己之(Zhi)力讓其産品得到世界的擁抱。

衆人拾[Shi]材[Cai]火焰高:用(Yong)平台籠絡世界的力(Li)量

要(Yao)實現人工[Gong]智能,機器必須[Xu]具備自主學習能力,深度學習[Xi]作為機器學習領域[Yu]的重大突破,可以完成具有高度抽象特(Te)征的人工智能任務(Wu),如自然語言理(Li)解等[Deng]複雜場景,因而備受[Shou]業界追捧。當然,機器[Qi]學習領域[Yu]并不隻(Zhi)是(Shi)有深度[Du]學(Xue)習這一種(Zhong)算法的存在,然而深[Shen]度學習[Xi]卻有着顯著[Zhe]的優勢:在數據集足夠大的情況下,深度學習擁有(You)最好的預測能力。盡(Jin)管在算法的選擇[Ze]上仍然存在(Zai)“殺雞焉用[Yong]宰[Zai]牛刀”的[De]争(Zheng)論(Lun),但深度學習算法為人工智能領(Ling)域注[Zhu]入的強(Qiang)大能力卻是其他算法無以比(Bi)拟的;同時,随着深度(Du)學習技術(Shu)的成熟[Shu],諸多傳統機器學習算法的淘汰幾乎是必[Bi]然的。然而正如前述,深度(Du)學習對大量數(Shu)據的需求及(Ji)其[Qi]本(Ben)身(Shen)的複雜性[Xing]仍然是其發展[Zhan]壯[Zhuang]大路上的最大阻礙[Ai],也是業界的無奈所在。

百[Bai]度在此[Ci]領域[Yu]發力較早,且(Qie)在[Zai]諸多方向上進(Jin)行了深入的研究[Jiu],利用深[Shen]入學[Xue]習結合自身搜(Sou)索引擎的大數據讓機器翻譯及自然語言等技術(Shu)實現了新(Xin)的飛躍。然而在[Zai]面向(Xiang)更廣大更具體(Ti)的應用場(Chang)景時,任何一個公司都難以滿足所有需求[Qiu]。借鑒曆史,開[Kai]放共[Gong]赢不僅可以把(Ba)事情做的,也讓[Rang]業界[Jie]和生态系統得到健(Jian)康發展。

百度此[Ci]次(Ci)開(Kai)源也是完全奔着建平台去的[De]。完全(Quan)采用C++語言[Yan]搭[Da]建核心,為平(Ping)台的穩定高效[Xiao]運行奠定了基礎;覆蓋[Gai]了(Le)三類最常(Chang)用的機器學(Xue)習算法,包括用于點擊預測(Ce)的稀疏線[Xian]性模型、用于(Yu)排序的決策樹模型以及深入學(Xue)習,滿足了最廣大的需求;重點開發(Fa)的“蟲洞(Dong)”項目将自(Zi)動[Dong]構建深盟所有項目,為所(Suo)有組件提供一(Yi)緻的數據(Ju)流支持且提供包括[Kuo]Amazon EC2,Microsoft Azure, Google Compute Engine在内的雲計算[Suan]平台兼容支持(Chi),降(Jiang)低平台的(De)準入門(Men)檻。

開(Kai)源并[Bing]入駐Github也進(Jin)一步(Bu)強調了其開放[Fang]的心态和對(Dui)平台的信心。一(Yi)系列的動作都是[Shi]希(Xi)望讓開發者(Zhe)可以[Yi]獲得更優質更[Geng]容易使用的深入學習算法源碼,降低(Di)開發和部[Bu]署深入(Ru)學習系統及相關(Guan)應用的門檻,進而利用世界的力量壯大自(Zi)身。

面對(Dui)可預料的爆發,技術一定程度上漸發(Fa)成熟,但也因(Yin)為(Wei)各自的技[Ji]術基因和路線(Xian)差異,面臨着極大的分裂傾向(Xiang)。開放(Fang)的心(Xin)态擁抱(Bao)世界,打造機[Ji]器學習領域的國際[Ji]标準(Zhun),百度的此舉既(Ji)是對前期研究投入(Ru)的回[Hui]收保障,更是攜[Xie]手籠絡(Luo)友商,确保自(Zi)身的話語(Yu)權所在。