5月20日,百度在github上開源了其[Qi]深[Shen]度機器[Qi]學習平台[Tai]。此番發[Fa]布的深度機器學[Xue]習開源[Yuan]平台屬于“深盟”的開源組織(Zhi),其核心開發者(Zhe)來[Lai]自百[Bai]度深度學習研究院(IDL),微軟[Ruan]亞洲研究院(Yuan)、華盛頓大學[Xue]、紐約大(Da)學、香港[Gang]科技大學,卡耐基·梅隴大學等知名[Ming]公司和高校[Xiao]。
通過這一開[Kai]源[Yuan]平台,世界各地的開發[Fa]者們可(Ke)以免費獲得更[Geng]優質[Zhi]和更容易使用的分布[Bu]式機[Ji]器學習算法[Fa]源碼(Ma),從而大幅降低開發和部署分布式機器學習系統及相(Xiang)關應用的(De)門檻。包括今日頭條、汽車之家[Jia]等在[Zai]内的多家公司[Si]已經通過該開放平台受益。
作[Zuo]為在人工智能布局(Ju)較早的玩[Wan]家(Jia),百度擁有領[Ling]先業界的實力[Li]。從2013年百度(Du)深度學習研[Yan]究院(IDL)的創建及2014年Andrew Ng的加盟至[Zhi]今,百度DMLC分布式深度[Du]機器(Qi)學習開源項目[Mu](簡稱“深盟”)已在深度學習的多個(Ge)應用領域做過探索,上線(Xian)了如xgboost(速度快效果好的(De)Boosting模(Mo)型)、CXXNET(極緻(Zhi)的C++深度學習庫)、Minerva(高[Gao]效靈活的并[Bing]行深度學習(Xi)引擎)以及Parameter Server(一小時訓練600T數(Shu)據)等産品,在語音識别[Bie]、OCR識[Shi]别、人臉識别以及(Ji)計算效(Xiao)率(Lü)提(Ti)升上發布了(Le)多個[Ge]成熟産品[Pin]。
而具[Ju]有一系列領先(Xian)優勢的百度卻選擇開[Kai]源其深度機[Ji]器學習平台,為何交底(Di)自(Zi)己的核心技術(Shu)?
深思之下,卻是在[Zai]面對業界無奈時的遠見之舉。
擁抱世界:開源的(De)魅力
開源,顧名思義[Yi],就是開放自己的源代碼[Ma]給别人查閱和使用,盡管看起(Qi)來很傻[Sha],然而諸多曆史事實卻告訴(Su)我們擁抱世界也能讓[Rang]世界擁抱你。
Android的逆襲就是[Shi]明證,在iOS侵占絕大多數智能手機操作系統的時代誕生,Google選[Xuan]擇開(Kai)源,讓早已在(Zai)蘋果面前沒(Mei)有機會的業界見到了希望,至今Android已擁有過半的市場份[Fen]額,以[Yi]至于在移動互[Hu]聯網大行其道的今天,Google可以憑借它與旗(Qi)下産品的[De]整合打造屬于自己的強(Qiang)大生(Sheng)态系統。相比之下,生(Sheng)而嬌貴的Windows mobile的故事夠[Gou]令人發醒的,終于微軟也不得不寄人籬下地去兼容Android和iOS平台[Tai]應用。此(Ci)外,作為微軟(Ruan)最主要的應用程序框架,微軟對.net寄予厚望,希望它(Ta)的開(Kai)源可(Ke)以來到所有平台,進(Jin)而重現JAVA的光輝曆史(Shi)。這也證明了[Le]即[Ji]使強[Qiang]大如微軟也無法憑借一己之力讓其産(Chan)品[Pin]得到世界的[De]擁抱。
衆人拾[Shi]材火焰高:用平台籠絡世界的力(Li)量
要實現人工智能,機器必須[Xu]具備自主學習能力,深度學習作為機[Ji]器學習領域[Yu]的重大突破,可以完成具有高度抽象(Xiang)特征的人工智能[Neng]任務,如自然語言理解等複雜場景,因而(Er)備受(Shou)業界追捧。當然(Ran),機器(Qi)學習領域并不隻是有深度(Du)學習這一種算法的存在,然[Ran]而深(Shen)度[Du]學習(Xi)卻(Que)有着顯著[Zhe]的優勢:在數據集足夠大(Da)的情況下(Xia),深[Shen]度學習擁有[You]最好的預測能力。盡[Jin]管在算法[Fa]的選擇(Ze)上仍然(Ran)存在(Zai)“殺雞焉用宰牛刀”的争論(Lun),但深度學習(Xi)算[Suan]法為人工智能領[Ling]域注入的強大能力卻[Que]是其他[Ta]算法無以比[Bi]拟的;同時,随着深度學習技[Ji]術的成熟,諸多傳統機器學習算(Suan)法的淘汰幾乎(Hu)是必(Bi)然的。然而正如前[Qian]述,深度學習對大量數據的(De)需求及(Ji)其本(Ben)身的複雜性(Xing)仍然是其發展[Zhan]壯大路上(Shang)的最大阻礙[Ai],也是業界的無奈所在[Zai]。
百(Bai)度在此[Ci]領域發力較早,且(Qie)在(Zai)諸多方向上進(Jin)行了深入的研究,利(Li)用深入學習結合自身搜[Sou]索引擎的大(Da)數(Shu)據讓機器[Qi]翻譯及自然[Ran]語言等技術實現了新[Xin]的飛躍。然而在[Zai]面向更廣大更具體的應用場景時,任何一個公司都難以滿足所有需求(Qiu)。借[Jie]鑒曆史,開放共[Gong]赢不僅可以把事情做的,也讓業界(Jie)和生态系統[Tong]得到健康發[Fa]展。
百度此次開(Kai)源也是完全奔(Ben)着建平台去的。完全采用C++語言搭建核心,為平[Ping]台的穩定高效運行奠定了基[Ji]礎;覆蓋了[Le]三類最常(Chang)用的機器學習算法,包括(Kuo)用于點擊預測的稀疏線性模型、用于排序的[De]決策樹[Shu]模型以及深入學習,滿足了最廣大的需求;重點開發[Fa]的“蟲洞”項目将(Jiang)自[Zi]動[Dong]構建深盟所有項目,為所(Suo)有組件提供一[Yi]緻的數據(Ju)流支持且提供包括Amazon EC2,Microsoft Azure, Google Compute Engine在内的雲計算(Suan)平台兼容支持[Chi],降低平台的準入門檻。
開源并入駐Github也進一步強調了其(Qi)開放的心态和對平[Ping]台的[De]信心。一[Yi]系列的動作[Zuo]都是(Shi)希望讓開發者[Zhe]可以獲得更優質更容易使用的深入學(Xue)習算法源碼,降低[Di]開[Kai]發和部署深入學習[Xi]系統及相關(Guan)應用的門檻(Kan),進而(Er)利用世界的力量[Liang]壯大自身。
面對可預料的爆發,技術一(Yi)定程度上漸發[Fa]成熟,但也因為各自[Zi]的技術基(Ji)因和路線差異,面臨着極大的(De)分[Fen]裂傾向。開放的心态擁抱世[Shi]界,打造機[Ji]器學[Xue]習領域(Yu)的國際[Ji]标(Biao)準,百度的此(Ci)舉[Ju]既是對前期研究投入的回收保障,更是攜手籠絡友商,确保自身的話語權[Quan]所在。
公司新聞
網站首頁 > 公司新聞(Wen)
百度為何開(Kai)源深(Shen)度[Du]機器學習平台(Tai)?