王海峰:深度學(xué)習(xí)已經(jīng)廣泛運(yùn)用,它的關(guān)鍵物品是啥?
2022-05-24 14:40:31
6月28日早上信息,2019年全世界服務(wù)外包產(chǎn)業(yè)發(fā)展趨勢(shì)發(fā)展論壇今天揭幕,百度搜索首席技術(shù)官王海峰發(fā)布演說。
王海峰強(qiáng)調(diào),深度學(xué)習(xí)已經(jīng)廣泛運(yùn)用,它的核心內(nèi)容的東西是深度學(xué)習(xí)框架,可以說深度學(xué)習(xí)框架是大數(shù)據(jù)時(shí)代的電腦操作系統(tǒng),它往下會(huì)連接處理芯片,芯片會(huì)對(duì)于深度學(xué)習(xí)框架里邊的這種計(jì)算來開展提升,往上是支撐點(diǎn)各種各樣運(yùn)用,關(guān)鍵的部位有訓(xùn)練框架,擁有許多數(shù)據(jù)信息,跟運(yùn)用有關(guān)的數(shù)據(jù)信息,隨后開展訓(xùn)練,訓(xùn)練獲得模型。隨后預(yù)測(cè)分析框架會(huì)根據(jù)已經(jīng)訓(xùn)練好的模型,對(duì)于運(yùn)用與應(yīng)用緊密結(jié)合,最終完成真正意義上的運(yùn)用。除開訓(xùn)練框架和預(yù)測(cè)分析框架之外,也有對(duì)應(yīng)的各種各樣輔助軟件。
他覺得,深度學(xué)習(xí)一旦運(yùn)用到某一個(gè)領(lǐng)域里邊,包含度假旅游、貨運(yùn)物流、零售、車輛等,都是會(huì)產(chǎn)生較大的經(jīng)濟(jì)收益的提高。除此之外,王海峰還詳細(xì)介紹了百度搜索的深度學(xué)習(xí)服務(wù)平臺(tái)飛槳,英文名叫PaddlePaddle?,F(xiàn)階段,飛槳官方網(wǎng)適用超出70個(gè)流行的模型,包含視覺效果的自然語言處理的、強(qiáng)烈推薦的、語言表達(dá)的等。(春燕)
下列為王海峰演說全篇:
今日大會(huì)的題材是手機(jī)軟件,我便跟各位共享一個(gè)人工智能技術(shù)時(shí)期十分關(guān)鍵的技術(shù)性軟件系統(tǒng),深度學(xué)習(xí)服務(wù)平臺(tái)。百度搜索的深度學(xué)習(xí)服務(wù)平臺(tái)的中文名稱是飛槳、英文名叫PaddlePaddle。
我們知道人類社會(huì)以往數(shù)百年已經(jīng)經(jīng)歷了三次工業(yè)革命,是靠人力的標(biāo)準(zhǔn),之后擁有人工神經(jīng)網(wǎng)絡(luò),以往這么多年促進(jìn)人工智能技術(shù)在各個(gè)領(lǐng)域廣泛運(yùn)用的是深度學(xué)習(xí),自然深度學(xué)習(xí)也是機(jī)器學(xué)習(xí)算法的一個(gè)支系。
我剛才談起促進(jìn)科技革命的工藝通常是實(shí)用的,大家看好多個(gè)事例,例如人工智能技術(shù)里邊一個(gè)很經(jīng)典的每日任務(wù)做內(nèi)容的鑒別。初期識(shí)別文字更常用標(biāo)準(zhǔn),隨后引進(jìn)一些人工神經(jīng)網(wǎng)絡(luò)的技術(shù)性,那時(shí)一個(gè)識(shí)別文字全過程很繁雜,例如一個(gè)非常典型的OCR系統(tǒng)軟件要分六步,從地區(qū)檢驗(yàn)、行切分、字分割這些解決下來才可以鑒別出去一些文本。用了深度學(xué)習(xí)技術(shù)性之后,減縮為二步,一個(gè)檢驗(yàn)一個(gè)鑒別,自然借助的是互聯(lián)網(wǎng)大數(shù)據(jù)的技術(shù)性。深度學(xué)習(xí)技術(shù)在OCR進(jìn)一步的演變變成了端到端的識(shí)別技術(shù),完成了多個(gè)任務(wù)協(xié)同訓(xùn)練,端到端的聯(lián)合學(xué)習(xí)培訓(xùn),包含特點(diǎn)的共用和相輔相成。
再看另一個(gè)在AI人工智能方面的技術(shù)性,自然語言處理,經(jīng)歷了從人力標(biāo)準(zhǔn)到全自動(dòng)學(xué)習(xí)培訓(xùn)到深度學(xué)習(xí)全過程,初期自然語言處理標(biāo)準(zhǔn)通常是靠權(quán)威專家,尤其是詞匯學(xué)權(quán)威專家融合各種各樣行業(yè)專業(yè)知識(shí)來寫的標(biāo)準(zhǔn),此刻項(xiàng)目成本十分高。并且從一個(gè)行業(yè)轉(zhuǎn)移到另一個(gè)行業(yè),或是從一個(gè)語言表達(dá)轉(zhuǎn)移到另一個(gè)語言表達(dá)都特別艱難。之后擁有人工神經(jīng)網(wǎng)絡(luò)自然語言處理之后,有大批量的模型,大家為了更好地應(yīng)用這種模型要實(shí)現(xiàn)數(shù)據(jù)信息挑選、訓(xùn)練、模型的選擇也有邏輯回歸模型這些,盡管自動(dòng)化技術(shù)水平高了許多,但還很不規(guī)范化,與此同時(shí)全過程也很繁雜。用了深度學(xué)習(xí)之后進(jìn)一步完成了更快的標(biāo)準(zhǔn)化管理和自動(dòng)化技術(shù)。深度學(xué)習(xí)即然已經(jīng)廣泛運(yùn)用,它的關(guān)鍵物品是啥?關(guān)鍵的東西是深度學(xué)習(xí)框架。大家可以說深度學(xué)習(xí)框架是大數(shù)據(jù)時(shí)代的電腦操作系統(tǒng),它往下會(huì)連接處理芯片,芯片會(huì)對(duì)于深度學(xué)習(xí)框架里邊的這種計(jì)算來開展提升,往上是支撐點(diǎn)各種各樣運(yùn)用,關(guān)鍵的部位有訓(xùn)練框架,擁有許多數(shù)據(jù)信息,跟運(yùn)用有關(guān)的數(shù)據(jù)信息,隨后開展訓(xùn)練,訓(xùn)練獲得模型。隨后預(yù)測(cè)分析框架會(huì)根據(jù)已經(jīng)訓(xùn)練好的模型,對(duì)于運(yùn)用與應(yīng)用緊密結(jié)合,最終完成真正意義上的運(yùn)用。
除開訓(xùn)練框架和預(yù)測(cè)分析框架之外,也有便是有相對(duì)的各種各樣輔助軟件。例如如何讓互聯(lián)網(wǎng)挑選更自動(dòng)化技術(shù),例如更低要求的進(jìn)到這些,有很多輔助軟件。
這就是百度搜索的飛槳深度學(xué)習(xí)服務(wù)平臺(tái),大伙兒見到這些服務(wù)平臺(tái)最下邊是關(guān)鍵框架,我剛才說的訓(xùn)練框架、預(yù)測(cè)分析框架這些都是在里邊,可是每一部分又有很多事要做,例如規(guī)模性分布式系統(tǒng)訓(xùn)練、工業(yè)生產(chǎn)級(jí)預(yù)備處理,要做可靠的數(shù)據(jù)加密這些,與此同時(shí)為每一個(gè)典型性的行業(yè)又會(huì)給予許多的模型庫,例如自然語言處理,對(duì)機(jī)器視覺、視頻語音、強(qiáng)烈推薦這些這種。專用工具建立,除開主要的學(xué)習(xí)培訓(xùn)框架之外,有深度學(xué)習(xí)的專用工具建立、有遷移學(xué)習(xí)的、有增強(qiáng)學(xué)習(xí)的,與此同時(shí)也有自動(dòng)化技術(shù)的網(wǎng)絡(luò)設(shè)計(jì)方案。從綜合服務(wù)平臺(tái)這一層,例如EDL,你即使不明白深度學(xué)習(xí)技術(shù)性也不明白敲代碼,運(yùn)用這一網(wǎng)站可以零基礎(chǔ)的定做和訓(xùn)練及其給予服務(wù)項(xiàng)目。
如今飛槳已經(jīng)官方網(wǎng)適用超出70個(gè)流行的模型,包含視覺效果的自然語言處理的、強(qiáng)烈推薦的、語言表達(dá)的這些。例如像在其中剛剛提及的自然語言處理,就保證了一系列面對(duì)工業(yè)生產(chǎn)使用的漢語的LP的工具箱,包含基本鏈路層,也包含網(wǎng)絡(luò)層,例如漢語的詞法分析、文本分析、詞義配對(duì)、會(huì)話這些。
這兒我講一個(gè)針對(duì)詞義的表述,根據(jù)詞義的解讀可以實(shí)現(xiàn)許多剖析了解解決的每日任務(wù)。大伙兒很有可能聽到過Google出了一個(gè)全自動(dòng)學(xué)習(xí)培訓(xùn),大家從數(shù)據(jù)信息里邊去全自動(dòng)訓(xùn)練自動(dòng)學(xué)習(xí)培訓(xùn),但與此同時(shí),人們的智能化我們都知道,很重要一點(diǎn)或是有常識(shí)的,因此大家做的專業(yè)知識(shí)提高的詞義表明模型,大伙兒能夠看見,跟基本的操作系統(tǒng)對(duì)比,各領(lǐng)域的特性都是會(huì)獲得一個(gè)挺大的提高,并且已經(jīng)取得了普遍的運(yùn)用。
再舉一個(gè)視頻的事例,短視頻的工具箱包含視頻播放的全自動(dòng)歸類、短視頻的詞義項(xiàng)量、視頻標(biāo)簽集這些,這種也會(huì)運(yùn)用于許多每日任務(wù),例如做信息流廣告、包含檢索包含語義上的各類系統(tǒng)軟件。右側(cè)是一個(gè)視頻的事例,大伙兒能夠看見如何剖析這個(gè)視頻。為了更好地用好深度學(xué)習(xí),一方面優(yōu)化算法要有領(lǐng)先的優(yōu)化算法,另一方面算率的支持也特別關(guān)鍵,因此大家有一系列分布式存儲(chǔ)的技術(shù)性里邊,大伙兒能夠看見,從單機(jī)版單卡到單機(jī)雙卡到多機(jī)多卡,全部訓(xùn)練的工藝也有非常大的提高。為了更好地支撐點(diǎn),大家有一個(gè)規(guī)模性的主要參數(shù)網(wǎng)絡(luò)服務(wù)器,這一也是在運(yùn)用中很重要的一部分,它可以滿足不一樣的情景,例如有高性能計(jì)算的數(shù)據(jù)信息、大量的特點(diǎn)及其融入數(shù)據(jù)信息自脹大的特性,包含高頻的可以開展模型的優(yōu)化。為了更好地做工業(yè)生產(chǎn)機(jī)數(shù)據(jù)信息的自解決,大家有一系列技術(shù)性,右側(cè)有一些技術(shù)性優(yōu)點(diǎn),例如分布式存儲(chǔ),IO直尺,性能卓越、多經(jīng)營者、多顧客的設(shè)計(jì)等這種。也有很重要的一點(diǎn),大家為了更好地讓它更普遍的運(yùn)用,通常在做一個(gè)運(yùn)用的情況下,不僅是在其中一個(gè)控制模塊搞好就可以了,更主要的還需要有端到端的全步驟布署計(jì)劃方案。
大伙兒見到,我們要搞好這一全過程的真真正正布署到一個(gè)運(yùn)用里邊去,必須有最底層硬件配置的適用,無論CPU、GPU或是挪動(dòng)端硬件配置,及其相對(duì)應(yīng)要有邏輯推理模塊,隨后有各種各樣不一樣的計(jì)算機(jī)語言的適用,相對(duì)應(yīng)的道具及其給予硬軟一體的方法這些一系列,產(chǎn)生全過程的構(gòu)建計(jì)劃方案。舉例說明,例如大家把那樣一套機(jī)器設(shè)備端布署解決方法用于開展鑒別病蟲害,那樣一個(gè)每日任務(wù),大家牽涉到最底層的服務(wù)平臺(tái),牽涉到專用工具站,牽涉到模型如何訓(xùn)練、怎么樣布署這些,自然這一系列是依托于搜索引擎的網(wǎng)站適用。
眾所周知如今深度學(xué)習(xí)的核心內(nèi)容是神經(jīng)元網(wǎng)絡(luò),互聯(lián)網(wǎng)第一步要做什么?第一步要做網(wǎng)絡(luò)架構(gòu)的設(shè)計(jì)方案,網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)方案前些年大量是靠人們權(quán)威專家來做這種設(shè)計(jì)方案,靠他的工作經(jīng)驗(yàn),經(jīng)驗(yàn)更足,人也許把網(wǎng)絡(luò)設(shè)計(jì)方案的更強(qiáng),進(jìn)而獲得更快的結(jié)論??墒沁@一環(huán)節(jié)實(shí)際上是技術(shù)專業(yè)度很高與此同時(shí)也很難的一個(gè)全過程,如今大家已經(jīng)可以實(shí)現(xiàn)智能化的網(wǎng)絡(luò)設(shè)計(jì)方案,這兒便是一個(gè)自動(dòng)化技術(shù)網(wǎng)絡(luò)設(shè)計(jì)方案的事例,大伙兒能夠看見,左側(cè)是權(quán)威專家手工制作設(shè)計(jì)方案的互聯(lián)網(wǎng),右側(cè)是設(shè)備全自動(dòng)設(shè)計(jì)方案的一個(gè)互聯(lián)網(wǎng)。大家根據(jù)這套全自動(dòng)設(shè)計(jì)方案互聯(lián)網(wǎng)AutoDL,也做好了開源系統(tǒng),也在PaddlePaddle開展了AutoDL一部分的開源系統(tǒng),與此同時(shí)也做好了模型的開源系統(tǒng),實(shí)際效果做到了比人力設(shè)計(jì)方案互聯(lián)網(wǎng)更強(qiáng)的實(shí)際效果,等同于它自動(dòng)化技術(shù)層度更高一些,節(jié)省成本,與此同時(shí)實(shí)際效果也更強(qiáng)。
前邊我提到深度學(xué)習(xí)如今用的十分廣,但并并不是每一個(gè)人都很全方位的把握了深度學(xué)習(xí)技術(shù)性,那麼大家能供應(yīng)一個(gè)更便捷的軟件服務(wù)平臺(tái),可以讓基本不過多乃至零基礎(chǔ)的人也可以來用、來處理自身的問題,大家出示了這種一個(gè)個(gè)性定制化訓(xùn)練和綜合服務(wù)平臺(tái),EasyDL,可以把多種數(shù)據(jù)信息送進(jìn)來開展生產(chǎn)加工學(xué)習(xí)培訓(xùn)、布署,最終給予服務(wù)項(xiàng)目,既可以給予云端服務(wù)也可以給予各種各樣智能產(chǎn)品上的服務(wù)項(xiàng)目。
這兒我不再講EasyDL身后的各類技術(shù)性,可是給各位看一個(gè)曲線圖,大家看一下根據(jù)EasyDL開展模型訓(xùn)練的總量在不斷的提高,如今已經(jīng)有超出三萬個(gè)第三方應(yīng)用的模型,根據(jù)EasyDL完成,隨后來處理自身的每日任務(wù)。
這也是另一個(gè)事例,糧食作物,在農(nóng)耕地塊的鑒別,這兒牽涉到在這個(gè)應(yīng)用領(lǐng)域里邊獲取對(duì)應(yīng)的數(shù)據(jù)信息,隨后用衛(wèi)星遙感數(shù)據(jù)信息開展模型訓(xùn)練,隨后開展結(jié)合、布署,最終進(jìn)行一個(gè),例如這一土地里邊,農(nóng)作物看起來如何,是否有災(zāi)難這些開展這類鑒別,全自動(dòng)的就可以開展農(nóng)耕地的檢測(cè)。剛剛舉的僅僅2個(gè)領(lǐng)域,大家看一下,事實(shí)上百度搜索的飛槳這一深度學(xué)習(xí)服務(wù)平臺(tái),已經(jīng)用在許多領(lǐng)域里邊,用在許多領(lǐng)域里邊,大家也相對(duì)的要看一看每個(gè)行業(yè)發(fā)展的發(fā)展趨勢(shì)。自然這一匯報(bào)是麥肯錫公司給予的匯報(bào),我們可以見到,深度學(xué)習(xí)一旦運(yùn)用到某一個(gè)領(lǐng)域里邊,很有可能產(chǎn)生的提高力度,大伙兒見到,度假旅游、貨運(yùn)物流、零售、車輛這些,每個(gè)領(lǐng)域都能夠因這一深度學(xué)習(xí)的使用產(chǎn)生較大的經(jīng)濟(jì)收益的提高。時(shí)長也到了,我今天的匯報(bào)就到這兒,希望大家的飛槳深度學(xué)習(xí)服務(wù)平臺(tái)能促進(jìn)人工智能技術(shù)發(fā)展趨勢(shì),加速產(chǎn)業(yè)鏈智能化系統(tǒng)。
謝謝你們!
王海峰自然語言處理深度學(xué)習(xí)百度搜索王海峰部分文章來源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系 caihong@youzan.com 刪除。