精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

由合成數(shù)據(jù)支持的可解釋人工智能

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2022-05-30 09:34 ? 次閱讀

數(shù)據(jù)是模型可解釋性的核心。可解釋人工智能( XAI )是一個(gè)快速發(fā)展的領(lǐng)域,旨在深入了解人工智能算法的復(fù)雜決策過程。

在人工智能對(duì)個(gè)人生活有重大影響的領(lǐng)域,如信用風(fēng)險(xiǎn)評(píng)分,管理者和消費(fèi)者都有權(quán)要求深入了解這些決策。領(lǐng)先的金融機(jī)構(gòu)已經(jīng)在利用 XAI 驗(yàn)證其模型。同樣,監(jiān)管機(jī)構(gòu)也要求深入了解金融機(jī)構(gòu)的算法環(huán)境。但在實(shí)踐中如何做到這一點(diǎn)呢?

潘多拉的封閉盒子

人工智能越先進(jìn),對(duì)可解釋性來(lái)說(shuō),數(shù)據(jù)就越重要。

現(xiàn)代的 ML 算法有集成方法和深度學(xué)習(xí),即使沒有數(shù)百萬(wàn)個(gè)模型參數(shù),也會(huì)產(chǎn)生數(shù)千個(gè)。當(dāng)應(yīng)用于實(shí)際數(shù)據(jù)時(shí),如果不看到它們的實(shí)際作用,就不可能掌握它們。

甚至在培訓(xùn)數(shù)據(jù)敏感的情況下,廣泛訪問數(shù)據(jù)的必要性也是顯而易見的。用于信用評(píng)分和保險(xiǎn)定價(jià)的金融和醫(yī)療數(shù)據(jù)是人工智能中使用最頻繁、但也是最敏感的數(shù)據(jù)類型。

這是一個(gè)相互矛盾的難題:你想要數(shù)據(jù)得到保護(hù),你想要一個(gè)透明的決策。

可解釋的 AI 需要數(shù)據(jù)

那么,這些算法如何變得透明呢?你如何判斷機(jī)器做出的模型決策?考慮到它們的復(fù)雜性,披露數(shù)學(xué)模型、實(shí)現(xiàn)或完整的訓(xùn)練數(shù)據(jù)并不能達(dá)到目的。

相反,您必須通過觀察各種實(shí)際案例中的決策來(lái)探索系統(tǒng)的行為,并探索其對(duì)修改的敏感性。這些基于示例的假設(shè)探索有助于我們理解是什么驅(qū)動(dòng)了模型的決策。

這種簡(jiǎn)單而強(qiáng)大的概念,即在給定輸入數(shù)據(jù)變化的情況下,系統(tǒng)地探索模型輸出的變化,也稱為 local interpretability ,可以在域和 model-agnostic 按比例 中執(zhí)行。因此,同樣的原則可以應(yīng)用于幫助解釋信用評(píng)分系統(tǒng)、銷售需求預(yù)測(cè)、欺詐檢測(cè)系統(tǒng)、文本分類器、推薦系統(tǒng)等。

然而,像 SHAP 這樣的局部可解釋性方法不僅需要訪問模型,還需要訪問大量具有代表性和相關(guān)的數(shù)據(jù)樣本。

圖 1 顯示了一個(gè)在模型上進(jìn)行的基本演示,該演示預(yù)測(cè)了客戶對(duì)金融行業(yè)內(nèi)營(yíng)銷活動(dòng)的反應(yīng)。查看相應(yīng)的 Python 調(diào)用可以發(fā)現(xiàn)需要經(jīng)過訓(xùn)練的模型,以及執(zhí)行這些類型分析的代表性數(shù)據(jù)集。然而,如果該數(shù)據(jù)實(shí)際上是敏感的,并且無(wú)法被 AI 模型驗(yàn)證器 訪問,該怎么辦?

poYBAGKUHy2ACkMBAACHb8tSQIQ037.png

圖 1 :。使用實(shí)際數(shù)據(jù)通過 SHAP 解釋模型的示例

用于跨團(tuán)隊(duì)擴(kuò)展 XAI 的合成數(shù)據(jù)

在人工智能采用的早期,通常是同一組工程師開發(fā)模型并對(duì)其進(jìn)行驗(yàn)證。在這兩種情況下,他們都使用了真實(shí)的生產(chǎn)數(shù)據(jù)。

考慮到算法對(duì)個(gè)人的現(xiàn)實(shí)影響,現(xiàn)在越來(lái)越多的人認(rèn)識(shí)到,獨(dú)立小組應(yīng)該檢查和評(píng)估模型及其影響。理想情況下,這些人會(huì)從工程和非工程背景中提出不同的觀點(diǎn)。

與外部審計(jì)師和認(rèn)證機(jī)構(gòu)簽訂合同,以建立額外的信心,確保算法是公平、公正和無(wú)歧視的。然而,隱私問題和現(xiàn)代數(shù)據(jù)保護(hù)法規(guī)(如 GDPR )限制了對(duì)代表性驗(yàn)證數(shù)據(jù)的訪問。這嚴(yán)重阻礙了模型驗(yàn)證的廣泛開展。

幸運(yùn)的是,模型驗(yàn)證可以使用高質(zhì)量的人工智能生成的 synthetic data 來(lái)執(zhí)行,它可以作為敏感數(shù)據(jù)的高度準(zhǔn)確、匿名的替代品。例如, AI 的 綜合數(shù)據(jù)平臺(tái) 主要使組織能夠以完全自助、自動(dòng)化的方式生成合成數(shù)據(jù)集。

圖 2 顯示了使用合成數(shù)據(jù)對(duì)模型執(zhí)行的 XAI 分析。比較圖 1 和圖 2 時(shí),結(jié)果幾乎沒有任何明顯的差異。同樣的見解和檢查也可以通過利用 AI 的隱私安全合成數(shù)據(jù)來(lái)實(shí)現(xiàn),這最終使真正的協(xié)作能夠在規(guī)模和連續(xù)的基礎(chǔ)上執(zhí)行 XAI 。

poYBAGKUHzWAToJHAACNHCZ-myc173.png

圖 2 :。使用合成數(shù)據(jù)通過 SHAP 解釋模型的示例

圖 3 顯示了跨團(tuán)隊(duì)擴(kuò)展模型驗(yàn)證的過程。組織在其受控的計(jì)算環(huán)境中運(yùn)行最先進(jìn)的合成數(shù)據(jù)解決方案。它不斷生成其數(shù)據(jù)資產(chǎn)的合成副本,可以與內(nèi)部和外部 AI 驗(yàn)證器的不同團(tuán)隊(duì)共享。

poYBAGKUHz2AVsKOAACZMhZvtYg286.png

圖 3 :。通過合成數(shù)據(jù)進(jìn)行模型驗(yàn)證的流程

使用 GPU 擴(kuò)展到真實(shí)數(shù)據(jù)量

GPU 加速的庫(kù),如 RAPIDS 和 Plotly ,能夠以實(shí)際遇到的實(shí)際用例所需的規(guī)模進(jìn)行模型驗(yàn)證。這同樣適用于生成合成數(shù)據(jù),其中以 AI 為動(dòng)力的合成解決方案(主要是 AI )可以通過在全棧加速計(jì)算平臺(tái)上運(yùn)行而受益匪淺。有關(guān)更多信息,請(qǐng)參閱 加速信用風(fēng)險(xiǎn)管理的可信 AI 。

為了證明這一點(diǎn),我們參考了房利美(Fannie Mae,F(xiàn)NMA)發(fā)布的抵押貸款數(shù)據(jù)集,目的是【VZX19】。我們首先生成一個(gè)具有統(tǒng)計(jì)代表性的訓(xùn)練數(shù)據(jù)合成副本,由數(shù)千萬(wàn)個(gè)合成貸款組成,由幾十個(gè)合成屬性組成(圖4)。

所有數(shù)據(jù)都是人工創(chuàng)建的,沒有一條記錄可以鏈接回原始數(shù)據(jù)集中的任何實(shí)際記錄。然而,數(shù)據(jù)的結(jié)構(gòu)、模式和相關(guān)性被忠實(shí)地保留在合成數(shù)據(jù)集中。

這種捕獲數(shù)據(jù)多樣性和豐富性的能力對(duì)于模型驗(yàn)證至關(guān)重要。該過程旨在驗(yàn)證模型行為,不僅針對(duì)占主導(dǎo)地位的多數(shù)階級(jí),還針對(duì)人口中代表性不足和最脆弱的少數(shù)群體。

poYBAGKUH0SAHnozAAFqlyWTHoA180.png

圖 4 :。真實(shí)和合成數(shù)據(jù)樣本的快照

給定生成的合成數(shù)據(jù),然后可以使用 GPU 加速的 XAI 庫(kù)來(lái)計(jì)算感興趣的統(tǒng)計(jì)信息,以評(píng)估模型行為。

例如,圖 5 顯示了 SHAP 值的并列比較:貸款拖欠模型在真實(shí)數(shù)據(jù)上解釋,在合成數(shù)據(jù)上解釋之后。通過使用高質(zhì)量的合成數(shù)據(jù)作為敏感原始數(shù)據(jù)的替代品,可以可靠地得出關(guān)于該模型的相同結(jié)論。

pYYBAGKUH02AVgcmAAEmMNRjMSA538.png

圖 5 :。貸款拖欠 ML 模型的 SHAP 值

圖 5 顯示,合成數(shù)據(jù)可以作為解釋模型行為的實(shí)際數(shù)據(jù)的安全替代品。

此外,合成數(shù)據(jù)生成器生成任意數(shù)量新數(shù)據(jù)的能力使您能夠顯著改進(jìn)較小組的模型驗(yàn)證。

圖 6 顯示了數(shù)據(jù)集中特定郵政編碼的 SHAP 值的并排比較。雖然原始數(shù)據(jù)在給定地理位置的貸款不到 100 筆,但我們利用 10 倍的數(shù)據(jù)量來(lái)檢查該區(qū)域的模型行為,從而實(shí)現(xiàn)更詳細(xì)和更豐富的見解。

pYYBAGKUH1WAVfIyAADvszyZZ9s677.png

圖 6 :。通過使用合成過采樣進(jìn)行模型驗(yàn)證,獲得更豐富的見解

使用合成樣品進(jìn)行單獨(dú)水平檢驗(yàn)

雖然匯總統(tǒng)計(jì)和可視化是分析一般模型行為的關(guān)鍵,但我們對(duì)模型的理解還可以通過逐個(gè)檢查單個(gè)樣本獲得更多好處。

XAI 工具揭示了多個(gè)信號(hào)對(duì)最終模型決策的影響。只要合成數(shù)據(jù)真實(shí)且具有代表性,這些案例不一定是實(shí)際案例。

圖 7 顯示了四個(gè)隨機(jī)生成的合成案例,以及它們的最終模型預(yù)測(cè)和每個(gè)輸入變量的相應(yīng)分解。這使您能夠在不暴露任何個(gè)人隱私的情況下,深入了解對(duì)無(wú)限潛在案例的模型決策有多大影響的因素和方向。

pYYBAGKUH1-AIueyAAEAh5pXEuk774.png

圖 7 :。檢驗(yàn)四個(gè)隨機(jī)抽樣合成記錄的模型預(yù)測(cè)

利用合成數(shù)據(jù)進(jìn)行有效的 AI 治理

人工智能驅(qū)動(dòng)的服務(wù)越來(lái)越多地出現(xiàn)在私營(yíng)和公共部門,在我們的日常生活中發(fā)揮著越來(lái)越大的作用。然而,我們只是在人工智能治理的黎明。

雖然像歐洲提議的人工智能法案這樣的法規(guī)需要時(shí)間才能體現(xiàn)出來(lái),但開發(fā)人員和決策者今天必須負(fù)責(zé)任地采取行動(dòng),并采用 XAI 最佳實(shí)踐。合成數(shù)據(jù)支持廣泛的協(xié)作環(huán)境,而不會(huì)危及客戶的隱私。它是一個(gè)強(qiáng)大、新穎的工具,可以支持開發(fā)和治理公平、健壯的人工智能。

關(guān)于作者

Jochen Papenbrock 位于德國(guó)法蘭克福,在過去的15年中,Jochen一直在金融服務(wù)業(yè)人工智能領(lǐng)域擔(dān)任各種角色,擔(dān)任思想領(lǐng)袖、實(shí)施者、研究者和生態(tài)系統(tǒng)塑造者。

Alexandra 是金融服務(wù)業(yè)的綜合數(shù)據(jù)專家,在隱私、公平和負(fù)責(zé)任的人工智能方面擁有深厚的專業(yè)知識(shí)。作為主要人工智能的首席信托官,她參與了有關(guān)隱私、道德人工智能和新興合成數(shù)據(jù)領(lǐng)域的公共政策討論,并定期在國(guó)際人工智能和銀行會(huì)議上發(fā)言,討論如何協(xié)調(diào)個(gè)性化與隱私,確保算法的公平性,以及如何克服數(shù)字轉(zhuǎn)型帶來(lái)的數(shù)據(jù)挑戰(zhàn)。除此之外, Alexandra 還是數(shù)據(jù)民主化播客的主持人,她邀請(qǐng)一些最大銀行的高管討論隱私和道德 AI 最佳實(shí)踐。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4701

    瀏覽量

    128705
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30146

    瀏覽量

    268411
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46858

    瀏覽量

    237553
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    嵌入式和人工智能究竟是什么關(guān)系?

    數(shù)據(jù)傳輸?shù)膲毫Γ€提高了系統(tǒng)的響應(yīng)速度。而在物聯(lián)網(wǎng)中,嵌入式系統(tǒng)更是一個(gè)核心的組成部分。通過將人工智能算法應(yīng)用于物聯(lián)網(wǎng)設(shè)備,我們可以實(shí)現(xiàn)對(duì)海量數(shù)據(jù)智能分析,從而為各種應(yīng)用場(chǎng)景提供精
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    探討了人工智能如何通過技術(shù)創(chuàng)新推動(dòng)能源科學(xué)的進(jìn)步,為未來(lái)的可持續(xù)發(fā)展提供了強(qiáng)大的支持。 首先,書中通過深入淺出的語(yǔ)言,介紹了人工智能在能源領(lǐng)域的基本概念和技術(shù)原理。這使得我對(duì)人工智能
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    閱讀這一章后,我深感人工智能與生命科學(xué)的結(jié)合正引領(lǐng)著一場(chǎng)前所未有的科學(xué)革命,以下是我個(gè)人的讀后感: 1. 技術(shù)革新與生命科學(xué)進(jìn)步 這一章詳細(xì)闡述了人工智能如何通過其強(qiáng)大的數(shù)據(jù)處理和分析能力,加速生命科學(xué)
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和規(guī)律。 2. 高性能
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等先進(jìn)技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不僅極大地提高了
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    其在人工智能圖像處理領(lǐng)域的應(yīng)用提供更多支持。 標(biāo)準(zhǔn)化和規(guī)范化推進(jìn) :為了降低RISC-V的碎片化風(fēng)險(xiǎn)并促進(jìn)其在全球范圍內(nèi)的廣泛應(yīng)用,標(biāo)準(zhǔn)化和規(guī)范化將是未來(lái)的重要趨勢(shì)。這將有助于提升RISC-V技術(shù)
    發(fā)表于 09-28 11:00

    人工智能ai4s試讀申請(qǐng)

    目前人工智能在繪畫對(duì)話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書對(duì)ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會(huì)材料。看能否有助于入門和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    大力發(fā)展AI for Science的原因。 第2章從科學(xué)研究底層的理論模式與主要困境,以及人工智能三要素(數(shù)據(jù)、算法、算力)出發(fā),對(duì)AI for Science的技術(shù)支撐進(jìn)行解讀。 第3章介紹了在
    發(fā)表于 09-09 13:54

    報(bào)名開啟!深圳(國(guó)際)通用人工智能大會(huì)將啟幕,國(guó)內(nèi)外大咖齊聚話AI

    ,得到了華為、騰訊、優(yōu)必選、中煤科工、中國(guó)聯(lián)通、云天勵(lì)飛、考拉悠然、智航、力維智聯(lián)等國(guó)內(nèi)人工智能企業(yè)的深度參與和大力支持。 報(bào)名后即可到現(xiàn)場(chǎng)領(lǐng)取禮品,總計(jì)5000份,先到先選! 點(diǎn)擊報(bào)名:https://bbs.elecfans.com/jishu_2447254_1
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    定制化的硬件設(shè)計(jì),提高了硬件的靈活性和適應(yīng)性。 綜上所述,F(xiàn)PGA在人工智能領(lǐng)域的應(yīng)用前景廣闊,不僅可以用于深度學(xué)習(xí)的加速和云計(jì)算的加速,還可以針對(duì)特定應(yīng)用場(chǎng)景進(jìn)行定制化計(jì)算,為人工智能技術(shù)的發(fā)展提供有力支持
    發(fā)表于 07-29 17:05

    機(jī)器視覺和人工智能的關(guān)系與應(yīng)用

    視覺信息的技術(shù)。它涉及到圖像的獲取、處理、分析和解釋,以實(shí)現(xiàn)對(duì)物體、場(chǎng)景和事件的識(shí)別、定位、測(cè)量和分類。機(jī)器視覺系統(tǒng)通常圖像采集設(shè)備、圖像處理軟件和執(zhí)行器組成,可以應(yīng)用于各種自動(dòng)化和智能化的場(chǎng)景。
    的頭像 發(fā)表于 07-16 10:27 ?777次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2) 課程類別 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識(shí)指引 14分50秒 https
    發(fā)表于 05-10 16:46

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    課程類別 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識(shí)指引 14分50秒 https://t.elecfans.com/v/25508.html *附件:參賽基礎(chǔ)知識(shí)指引
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下,嵌入式人工智能成為國(guó)家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。同時(shí)在此背景驅(qū)動(dòng)下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17

    語(yǔ)音數(shù)據(jù)集在人工智能中的應(yīng)用與挑戰(zhàn)

    一、引言 隨著人工智能技術(shù)的快速發(fā)展,語(yǔ)音數(shù)據(jù)集在各種應(yīng)用中發(fā)揮著越來(lái)越重要的作用。語(yǔ)音數(shù)據(jù)集是AI語(yǔ)音技術(shù)的基石,對(duì)于語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音情感分析等任務(wù)具有重要意義。本文將詳細(xì)介
    的頭像 發(fā)表于 12-14 15:00 ?648次閱讀