中文字幕亚洲无线码_国产成人免费高清_中国国产不卡视频_a在线观看免费网址大全_黑人巨茎大战欧美_少妇人妻精品专区AV_国产亚洲精品超碰_国产免费拔擦拔擦8x_国产精品亚洲一区二区无码_国产成人亚洲精品无码电影,久久精品男人的天堂AV,中文字幕免费观看视频,亚洲国产AV无码专区亚洲AV

公司介紹 新聞動態(tài) 聯(lián)系我們
知識圖譜:從“數(shù)據(jù)”競爭到“技術(shù)”競爭
2021-07-06來源: Amber Dr.Huang作者: Amber Dr.Huang

|“用知識圖譜定位客戶,,可防失聯(lián)/跑路,?!?/span>

或許你已經(jīng)耳熟能詳人工智能,,但是對此你并不滿意,。你吐槽:這個機器太愚蠢了,!這個分析報告,,人類根本無法理解,。

那是因為人工智能還是一個牙牙學語的稚子,,處于智能化轉(zhuǎn)型的初級階段,。今天我們就來聊聊知識圖譜,一項將賦予機器認知智能的關(guān)鍵技術(shù),。

知識圖譜:從“數(shù)據(jù)”競爭到“技術(shù)”競爭
(圖片來源于網(wǎng)絡(luò),,如有侵權(quán),請聯(lián)系刪除

一,、什么是知識圖譜,?

知識圖譜(Knowledge graph,KG)是一種知識庫技術(shù),,在上世紀五六十年代就已萌芽,,起源于語義網(wǎng)絡(luò)的知識表現(xiàn)形式。

語義網(wǎng)絡(luò)的本義是,,知識由相互連接的節(jié)點和邊組成,,節(jié)點表示概念或者對象,邊表示他們之間的關(guān)系。在知識圖譜里,,每個節(jié)點表示現(xiàn)實世界中存在的“實體”,,每條邊為實體與實體之間的“關(guān)系”。在表現(xiàn)形式上,,語義網(wǎng)絡(luò)和知識圖譜相似,,但語義網(wǎng)絡(luò)更側(cè)重于描述概念與概念之間的關(guān)系,而知識圖譜則更偏重于描述實體之間的關(guān)聯(lián),。所以,,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關(guān)系網(wǎng)絡(luò),提供從“關(guān)系”的角度去分析問題的能力,。

“知識圖譜”這個概念具體什么時候被提出,,網(wǎng)上有多種說法,廣為業(yè)內(nèi)認可的是2012年,,Google首次公開將其應(yīng)用在搜索上,,也是自此,知識圖譜成為了研究應(yīng)用的熱點,。比如在谷歌上搜索“唐納德川普”,,在搜索結(jié)果頁面的右側(cè)會出現(xiàn)與之相關(guān)的身份信息、行為信息,、社交信息,、關(guān)聯(lián)人等。

知識圖譜:從“數(shù)據(jù)”競爭到“技術(shù)”競爭

二,、知識圖譜的基本特性

有了知識圖譜,,機器看到的就不再是簡單的字符串,而是可以把這些字符串映射到各種各樣的實體,、概念,,從而建立機器自己的認知世界,更直觀的為場景服務(wù),。

下面簡單梳理一下知識圖譜的基本特性:

  • 網(wǎng)狀知識結(jié)構(gòu)

  • 復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)

  • 網(wǎng)絡(luò)由節(jié)點,、邊、以及它們的屬性構(gòu)成

  • 知識庫是知識圖譜承載數(shù)據(jù)的主要方式

也就是說,,知識圖譜是由一些相互連接的實體和他們的屬性構(gòu)成的,。換句話說,知識圖譜是由一條條知識組成,,每條知識表示為一個SPO三元組(Subject-Predicate-Object),。如:(堂吉訶德,作者,,塞萬提斯)

常用RDF來形式化地表示這種三元關(guān)系,。RDF(Resource Description Framework),,即資源描述框架,是W3C制定的,,用于描述實體/資源的標準數(shù)據(jù)模型,。

知識圖譜的表示方式之一RDF

知識圖譜的表示方式之一RDF

(Semantic similarity analysis and application in knowledge graphs, Ganggao, Zhu, Phd Thesis, 2017)

RDF圖中一共有三種類型,International Resource Identifiers(IRIs),,blank nodes 和 literals,。現(xiàn)實中,這種呈現(xiàn)方式的典型應(yīng)用有Walfram Alpha知識庫,。它是目前世界上包含實體數(shù)最多的知識庫,,總量超過10萬億條。


知識圖譜的表示方式之一RDF

?

三,、知識圖譜的關(guān)鍵理論和技術(shù)

早期語義網(wǎng)絡(luò)研究如何將數(shù)據(jù)表示成機器和人都可以理解的, 所以核心的研究方向是對元數(shù)據(jù)的研究,,即如何描述數(shù)據(jù)。知識圖譜是在語義網(wǎng)基礎(chǔ)上發(fā)展起來的,,包含上億的事實和他們之間的關(guān)系,。

自然語言處理技術(shù)推動了知識圖譜應(yīng)用,知識圖譜也為自然語言處理提供更廣闊的應(yīng)用空間,,所以知識圖譜中的關(guān)鍵理論和技術(shù)涉及到很多自然語言處理,。

例如text analysis, document retrieval, entity linking, word sense disambiguation, name entity disambiguation, query interpretation, question answer.

知識圖譜的技術(shù)架構(gòu)

知識圖譜的技術(shù)架構(gòu)
?

(劉嶠 李楊 段宏 劉瑤 秦志光 出版源:《計算機研究與發(fā)展》, 2016, 53 (3):582-600 2

三、知識圖譜主要應(yīng)用場景

知識圖譜最大的優(yōu)勢在于對數(shù)據(jù)的描述能力很強大,,機器學習,、深度學習算法雖然在預(yù)測能力上不錯,但在描述能力上卻差強人意,,知識圖譜則剛好填補了這部分空白,。

雖然知識圖譜是當前研究的熱點,但在國內(nèi)尚屬一個比較新的概念,,其應(yīng)用也處于初始階段,,主要集中在諸如通信,、醫(yī)療,、互聯(lián)網(wǎng)、金融等對技術(shù)敏感的行業(yè)領(lǐng)域,。

下面,,我們對已有應(yīng)用做一個簡單介紹:

1、語義搜索

語義搜索的功能類似于知識圖譜在Google, Baidu上的應(yīng)用,,通過知識圖譜擴展用戶的搜索關(guān)鍵詞,,從而返回更豐富、更全面的信息,。

舉個應(yīng)用案例,,搜索“價格在10萬以下的白色長安汽車”:


語義搜索

首先是句法分析,,通過實體識別,分解搜索需求,,如人名,、地名、品牌名,、顏色等,,然后根據(jù)分析結(jié)果,搜索目標-汽車,,目標屬性-白色,、長安、價格0-10萬,,最后,,將這些結(jié)果用圖形網(wǎng)絡(luò)的方式展示,就把復(fù)雜的信息以直觀明了的圖像呈現(xiàn)出來,,讓使用者對隱藏信息的來龍去脈一目了然,。

2、智能問答

智能問答功能同樣也可以體現(xiàn)在搜索引擎上,,通過構(gòu)建龐大的知識庫,,訓練機器,讀懂人類的需求,。

如蘋果Siri,、電信客服、銀行智能語音助手,、健康助理等,。其應(yīng)用過程同語義搜索,只是在表現(xiàn)上還加入了其他技術(shù),,如語音識別,、圖形識別等。

智能問答

?

3,、風險控制

現(xiàn)代商業(yè)發(fā)展面臨的風險因素日趨復(fù)雜,,利用知識圖譜可以構(gòu)建行業(yè)的知識庫,進行風險挖掘,,從而達到控制風險,,管理風險的目的,典型應(yīng)用有金融領(lǐng)域的反欺詐和風險預(yù)測,。

那么,,如何構(gòu)建金融知識圖譜?

“金融知識圖譜”是金融行業(yè)知識搜索的基礎(chǔ)技術(shù),,是具有語義處理與信息互聯(lián)互通能力的知識庫,。構(gòu)建“金融知識圖譜”可以提升金融機構(gòu)反欺詐,、風險評估、預(yù)測等風險管理能力,。

構(gòu)建“金融知識圖譜”可分為兩大部分:一是數(shù)據(jù)梳理,,基于資金往來,賬戶,抵押物,股權(quán)結(jié)構(gòu),訴訟,聯(lián)系方式等關(guān)系建立企業(yè),人, 事件等實體間的關(guān)系圖譜;二是基于知識圖譜的數(shù)據(jù)挖掘應(yīng)用,,例如:擔保圈分析,,可挖掘出循環(huán)擔保;深度風險鏈條分析,揭示多層網(wǎng)絡(luò)中風險關(guān)系,;客戶群體劃分,,可以提取滿足一定條件的客戶用于獲客。

下面以譽存科技應(yīng)用知識圖譜做企業(yè)風險評估的項目為例來介紹

風險控制
(譽存科技知識圖譜應(yīng)用流程

1,、定義需求:落實到具體業(yè)務(wù)問題,,提出可視化需求。如風險關(guān)系挖掘,、失信預(yù)測

2,、數(shù)據(jù)收集和預(yù)處理:使用ETL+自然語言處理技術(shù),整合海量結(jié)構(gòu)化數(shù)據(jù)+非結(jié)構(gòu)化數(shù)據(jù)

3,、知識圖譜設(shè)計:定義實體,,關(guān)系,屬性

4,、知識圖譜存儲設(shè)計:Neo4j

5,、上層應(yīng)用開發(fā):基于規(guī)則,基于算法


知識圖片應(yīng)用

企業(yè)關(guān)聯(lián)圖譜的展示:主體企業(yè),、關(guān)聯(lián)企業(yè),、董監(jiān)高法等關(guān)聯(lián)人的重要關(guān)系梳理,圖譜化展示,。

譽存科技企業(yè)關(guān)聯(lián)網(wǎng)絡(luò)圖
譽存科技企業(yè)關(guān)聯(lián)網(wǎng)絡(luò)圖

(譽存科技企業(yè)關(guān)聯(lián)網(wǎng)絡(luò)圖

基于企業(yè)知識圖譜的企業(yè)風險挖掘:基于規(guī)則


基于企業(yè)知識圖譜的企業(yè)風險挖掘

(風險鏈條展示)

未來風險預(yù)測:基于機器學習算法或者傳導(dǎo)模型


未來風險預(yù)測

基于網(wǎng)絡(luò)風險傳導(dǎo)模型的失信風險預(yù)測:利用企業(yè)圖譜的拓撲結(jié)構(gòu)+啟發(fā)式算法

基于網(wǎng)絡(luò)風險傳導(dǎo)模型的失信風險預(yù)測

結(jié)語

當前,,各大互聯(lián)網(wǎng)科技公司都紛紛創(chuàng)建了自己的知識庫。大數(shù)據(jù)和新算法為規(guī)?;R圖譜構(gòu)建提供了新的技術(shù)基礎(chǔ)和發(fā)展條件,,使得知識圖譜構(gòu)建的來源、方法和技術(shù)手段都發(fā)生極大的變化,。

與數(shù)據(jù)與量化強相關(guān)的金融行業(yè),,對知識圖譜技術(shù)更是抱著開放,、歡迎的態(tài)度,。許多思想領(lǐng)先,對技術(shù)敏感的金融機構(gòu),,通過積極與金融科技公司合作,,已成功將知識圖譜運用于反欺詐,、智能推薦、智能風控,、營銷獲客等方面,,搶先獲得了技術(shù)賦能的優(yōu)勢與價值。未來,,在金融領(lǐng)域,,從精準營銷、風險預(yù)測到用戶決策,,知識圖譜的底層支撐性作用將越來越顯著,。

國內(nèi)領(lǐng)先的數(shù)字科技企業(yè)
聯(lián)系我們