如果說數(shù)據(jù)是新時(shí)代的石油,,那么學(xué)習(xí)算法就是從中提取信息的煉油廠;信息積累成知識,;知識深化成理解,;理解演變成智慧,。歡迎來到深度學(xué)習(xí)的新世界,。
? ? ? ? ? ?——特倫斯·謝諾夫斯基《深度學(xué)習(xí)》
2019年3月27日,,深度學(xué)習(xí)三巨頭迎來了他們的高光時(shí)刻:美國計(jì)算機(jī)協(xié)會(huì)(ACM)宣布,,將計(jì)算機(jī)領(lǐng)域的最高榮譽(yù)——圖靈獎(jiǎng)?lì)C發(fā)給約書亞 · 本吉奧(Yoshua Bengio),、楊立昆(Yann LeCun)和杰弗里 · 辛頓(Geoffrey Hinton),。頒獎(jiǎng)當(dāng)日,ACM主席切莉 · 潘可(Cherri M Pancake)在評價(jià)三位時(shí)說道,,“Hinton,、LeCun和Bengio獨(dú)立工作,共同開發(fā)了深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)領(lǐng)域的概念基礎(chǔ),,通過實(shí)驗(yàn)和實(shí)際工程證明了深度神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,。”
什么是深度學(xué)習(xí),?
自從2016年AlphaGo以四比一擊敗韓國頂尖圍棋選手李世乭開始,,人工智能(Artificial Intelligence)就成了普通人時(shí)常掛在嘴邊的熱詞。但人工智能究竟包含哪些研究方面呢,?
(人工智能研究分支)
人工智能所涵蓋的內(nèi)容非常廣泛,,是一個(gè)龐大的體系,我們同樣耳熟能詳?shù)臋C(jī)器學(xué)習(xí)也僅僅是其中一種實(shí)現(xiàn)人工智能的方法,,而深度學(xué)習(xí)則是一種實(shí)現(xiàn)機(jī)器學(xué)習(xí)的技術(shù),。
(人工智能、機(jī)器學(xué)習(xí),、深度學(xué)習(xí)的包含關(guān)系)
近年來,,在數(shù)據(jù)量的高速增長和算法、算力的不斷進(jìn)步之下,,深度學(xué)習(xí)取得了突破性的成果,,其在語音、圖像和自然語言處理等方面的表現(xiàn),,遠(yuǎn)遠(yuǎn)超過先前的相關(guān)技術(shù),。
基于圖像識別的AI醫(yī)療
長久以來,全球健康醫(yī)療領(lǐng)域一直面臨著人口增長,、老齡化嚴(yán)重,、慢性病發(fā)病率逐年提升及勞動(dòng)力不足等困境,就醫(yī)需求的激增和優(yōu)質(zhì)醫(yī)生資源的匱乏帶來的是醫(yī)療市場供需結(jié)構(gòu)的嚴(yán)重失衡,。
以CT圖像為例,,一個(gè)放療科醫(yī)生一次靶區(qū)勾畫的工作量約200-450張CT片,按傳統(tǒng)方式需要耗時(shí)5小時(shí)左右,,相當(dāng)于一天只能診斷1-2名患者,,極大的限制了醫(yī)學(xué)影像診斷的速度,且漏診,、誤診頻發(fā),。
基于深度學(xué)習(xí)的醫(yī)療影像分析則為提升醫(yī)療服務(wù)質(zhì)量帶來了希望。現(xiàn)階段的AI醫(yī)學(xué)影像系統(tǒng)可以在幾秒之內(nèi)快速完成對十萬張以上的影像處理,,針對腫瘤放療環(huán)節(jié)的影像處理技術(shù)能將一名醫(yī)生5個(gè)小時(shí)的工作量縮短到30分鐘,,大大提升診療效率。
在未來,,每個(gè)人都將是AI醫(yī)療的受益者,。
基于深度學(xué)習(xí)的自動(dòng)駕駛應(yīng)用
據(jù)統(tǒng)計(jì),全球每年有超過124萬人死于交通事故,,這個(gè)數(shù)字到2030年可能達(dá)到220萬人,,平均每天有500人因?yàn)榻煌ㄊ鹿蕟噬疃葘W(xué)習(xí)技術(shù)則能通過對道路標(biāo)識,、車道線,、行人、紅綠燈,、交通擁堵情況等信息進(jìn)行數(shù)據(jù)訓(xùn)練及特征提取,,幫助汽車快速精準(zhǔn)的理解周邊環(huán)境態(tài)勢,并基于當(dāng)前狀態(tài)做出正確的駕駛決策,。
以突發(fā)情況判斷為例,,一個(gè)普通駕駛員從肉眼感知異常狀況到手腳做出行動(dòng)需要大約0.6秒,用腳踩下制動(dòng)踏板到制動(dòng)系統(tǒng)開始起作用又需要大約0.6秒,,整整1.2秒的反應(yīng)時(shí)間,,按120km/h的車速來計(jì)算,汽車還將繼續(xù)行駛40米,,而對自動(dòng)駕駛系統(tǒng)而言,,這個(gè)過程被縮短到0.2秒,從系統(tǒng)反應(yīng)到停駛,,汽車僅僅繼續(xù)向前行駛7米,,大大提升安全性。
在未來,,自動(dòng)駕駛將重構(gòu)城市交通系統(tǒng),。
基于自然語言處理的金融科技應(yīng)用
如何用自然語言處理(NLP, Natural Language Processing)技術(shù)感知金融市場,?NLP是一門融語言學(xué)、計(jì)算機(jī)科學(xué),、數(shù)學(xué)為一體的學(xué)科,,是能夠讓智能機(jī)器理解并生成人類語言,從而和人類進(jìn)行溝通交流的重要技術(shù)手段,。在金融科技領(lǐng)域,,NLP技術(shù)主要基于海量大數(shù)據(jù)、預(yù)處理模型,、語言學(xué)等技術(shù)和資源,,實(shí)現(xiàn)文本分類、信息提取,、語言生成,、機(jī)器翻譯、智能問答,、情感分析等具體應(yīng)用,,進(jìn)而服務(wù)于實(shí)際金融業(yè)務(wù)及產(chǎn)品。
在金融領(lǐng)域,,每天產(chǎn)生的金融相關(guān)數(shù)據(jù)量非常龐大,,這其中包括公司新聞、金融產(chǎn)品資料,、宏觀經(jīng)濟(jì),、政策法規(guī)、社交媒體評論等,,因此從海量數(shù)據(jù)中獲取有效數(shù)據(jù)意義十分重大,。
以譽(yù)存科技的“三鏈合一”價(jià)值體系構(gòu)建為例。平臺以企業(yè)為分析主體,,通過工商,、新聞?wù)Z料、法務(wù),、招投標(biāo),、行政處罰、招聘等多維數(shù)據(jù),,對企業(yè),、行業(yè)從月度、季度,、年度等不同的時(shí)間粒度進(jìn)行多維度,、多指標(biāo)的統(tǒng)計(jì)分析,形成分布式數(shù)據(jù)庫,,應(yīng)用自然語言處理(NLP)領(lǐng)域的關(guān)系抽取,、文本分類等技術(shù),,獲得實(shí)體間上下游關(guān)系、股權(quán)投資關(guān)系,、原告被告關(guān)系,、合作競爭關(guān)系等,最終形成了企業(yè)知識關(guān)聯(lián)圖譜,,并應(yīng)用于價(jià)值鏈,、產(chǎn)業(yè)鏈和供應(yīng)鏈的分析:
以數(shù)據(jù)庫和企業(yè)知識圖譜為驅(qū)動(dòng),,在已確定的價(jià)值鏈分析目標(biāo)指導(dǎo)下對數(shù)據(jù)進(jìn)行深度挖掘,,過濾出各行業(yè)、地區(qū)的頭部企業(yè),,繪制區(qū)域產(chǎn)業(yè)的價(jià)值地圖,;
在企業(yè)知識圖譜中發(fā)現(xiàn)產(chǎn)業(yè)脈絡(luò),結(jié)合國家行業(yè)政策(扶持或去產(chǎn)能),,市場趨勢(如今年的房地產(chǎn)),,發(fā)展脈絡(luò)(如高污染)等,綜合分析區(qū)域價(jià)值鏈下的重點(diǎn)產(chǎn)業(yè)鏈,,精準(zhǔn)定位金融活動(dòng)集中地,;
供應(yīng)鏈則是將視野從頭部企業(yè)轉(zhuǎn)移到整個(gè)產(chǎn)業(yè)的局部產(chǎn)業(yè)塊,向前,、向后發(fā)掘企業(yè)在整個(gè)生產(chǎn)鏈條中起到的作用,,梳理企業(yè)相關(guān)的上下游關(guān)聯(lián)關(guān)系體系,并實(shí)時(shí)跟蹤供應(yīng)鏈變化趨勢,,動(dòng)態(tài)維持供應(yīng)鏈全息畫像,。
作為金融科技領(lǐng)域的“雙子星”,自然語言處理與知識圖譜的雙劍合璧,,實(shí)現(xiàn)了價(jià)值鏈,、產(chǎn)業(yè)鏈、供應(yīng)鏈的三鏈合一,,而其與金融信貸場景中全業(yè)務(wù)流程的緊密結(jié)合,,必將成為推動(dòng)普惠金融發(fā)展的重要?jiǎng)恿Α?/span>