精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

互聯網反欺詐問題提出的必要性及重要性、通用技術手段及應用場景

芯盾時代 ? 來源:芯盾時代 ? 作者:芯盾時代 ? 2020-09-25 14:35 ? 次閱讀

AI加持下的互聯網反欺詐
本文將從問題提出的必要性及重要性、通用技術手段及應用場景角度,對專家經驗規則自學習機制,風評模型可解釋性問題作系統全面的介紹,歡迎大家討論交流。

01

專家經驗規則自學習機制

在大數據時代背景下,金融犯罪和金融欺詐的新手段層出不窮,日漸趨于科技化、專業化、規模化,也更具有隱蔽性,由過去的單兵作戰演變成有規模、有組織的團伙欺詐,嚴重制約了傳統的專家知識庫、專家經驗規則持續有效地發揮作用,亟需解決兩方面問題:

基于數據算法驅動,自動化調整的場景規則集中的閾值和權重,以保障規則持續有效性;

從不同維度發掘時效性強的新風控規則,以持續豐富完善反欺詐規則集。

規則閾值、權重

規則閾值、權重學習涉及特征離散化、特征選擇、特征降維、權重參數回歸等流程。

信息熵:用來評估樣本集合的純度的一個參數,是系統的不確定性、隨機性度量指標。

卡方分箱原理:特征離散化算法,根據樣本數據推斷總體的分布與期望分布是否有顯著性差異, 或者推斷兩個分類變量是否相關或者獨立。

最小熵分箱:特征離散化算法,最小熵分箱是典型的自頂向下分箱方法。最小熵分箱將待分箱特征的所有取值都放到一個箱體里,然后依據最小熵原則進行箱體分裂。

基尼(gini)系數:特征離散化算法,總體內部包含越混亂,基尼系數越大;內部純度越高,基尼系數越小。

特征選擇:特征選擇在于選取對訓練數據具有分類能力的特征,提升模型整體預測能力,常用到技術包括lasso回歸、Feature Importance、特征共線性驗證等。

Lasso回歸:使用少量觀測值就能夠完全恢復出非零的系數。其中不同的是,樣本的數量需要“足夠大”,否則L1模型的表現會充滿隨機性。

新風控規則

新欺詐規則挖掘,根據規則中所處理的值類型分為兩類:

如果規則考慮的關聯是項的存在與不存在,則它是布爾關聯規則;

如果規則描述的是量化的項或屬性之間的關聯,則它是量化關聯規則。

本質是頻繁項集挖掘,常用到算法包括Apriori、FpGrowth。

Apriori算法利用頻繁集的兩個特性,過濾了很多無關的集合,效率提高不少,但是Apriori算法是一個候選消除算法,每一次消除都需要掃描一次所有數據記錄,造成整個算法在面臨大數據集時顯得無能為力。

FpGrowth算法通過構造一個樹結構來壓縮數據記錄,使得挖掘頻繁項集只需要掃描兩次數據記錄,而且該算法不需要生成候選集合,所以效率會比較高。

02

風評模型可解釋性問題

人工智能算法模型正在對金融行業產生重大影響,前提是要了解AI算法的優勢和局限性,以及適合在金融領域發揮作用的場景。當我們在金融業務中使用AI算法,期望通過可度量的方法對模型結果進行分析、解釋,以期對算法進行優化,對業務進行方向性的指導,確保模型與要解決的業務問題保持一致,即模型解釋性分析問題。模型的解釋性分析可幫助模型開發人員及業務運營人員了解并解釋模型中包含和未包含的特征因素,及特征如何影響模型結果。

廣義上,模型的解釋性分析目的是全局定義特征對模型的影響,同時定義單個特征對模型的個性化影響;更好的理解模型行為,更好的進行相應的業務決策;通常對機器學習模型分為“白盒”模型和“黑盒”模型:

“白盒”模型

“白盒”模型如線性、Logistic回歸模型,預測能力較弱,但是簡單易理解。線性關系如信貸欺詐與人口統計學特征、經濟收入等的相關性。決策樹模型(RandomForest vs XGBoost vs LightGBM)是目前業內公認可解釋性較好的非線性機器學習算法,模型每作出一個決策都會通過一個決策序列來向我們展示模型的決策依據,決策樹模型自帶的基于信息理論的篩選變量標準也有助于幫助我們理解在模型決策產生的過程中哪些變量起到了顯著的作用;白盒模型特征明確,邏輯簡單,本身具備可解釋性。

針對“白盒”模型,我們可以從數據分布圖、特征重要度、Embedding可視化、獨立特征分析(PDP)、全局性分析(SHAP)、局部特征信息(LIME)、特征相關性(相關系數)等維度提供分析技術。

特征重要度:從兩個角度分析“特征收益重要性”和“特征分裂重要性”;特征收益重要性指特征分類的平均訓練損失的減少量,意味著相應的特征對模型的相對貢獻值;特征分裂重要性是指訓練樣本決策分裂的次數,兩者從不同維度度量不同特征在模型訓練中的重要性。

獨立特征分析:我們通過特征重要度得知某個特征對模型的影響度,以及用SHAP來評估全局特征重要性;但如何評估某個單獨的特征,嘗試通過PDP來評估獨立特征,展示單個特征對于模型預測的邊際效益,單個特征是如何影響預測的,通過繪制特征和預測目標之間的一維關系圖或二維關系圖來了解特征與目標之間的關系。多個特征的復雜性,通過單個特征分析,進一步驗證單個特征對模型的影響度。

“黑盒”模型

“黑盒”模型使用復雜的機器學習算法(深度網絡學習)訓練數據,輸入特征經過組合變換,維度變換等特征工程步驟,需要分析及調整數據與模型,確保模型結果與要解決的問題保持一致;然而這些模型的內部機制難以理解,也無法估計每個特征對模型預測結果的重要性以解釋模型結果與輸入的特征屬性潛在的關聯關系,更無法直接理解不同特征之間如何相互工作(數據的相關性不等價于因果關系)。

針對“黑盒”模型,我們可以從深度網絡結構分析,風評結果命中團伙關聯圖譜角度去解釋模型有效性。

關聯圖譜提供豐富的圖構建、圖查詢、圖分析、圖嵌入、圖挖掘技術,通過社區檢測、關鍵節點分析、關聯分析、異常網絡結構發現等場景化算法和模型,提供風控和營銷等場景化輔助決策服務。如信用卡養卡套現識別,養卡套現團伙往往都與黑商戶溝通,正常養卡階段,消費的商戶相對固定,而通過遍歷關聯圖譜的方式,能夠基于上述行為特征建立欺詐關聯圖譜,識別養卡套現團伙。

風控場景對于數據、模型、特征的可解釋性,穩定性要求是重點,可解釋性和穩定性仍然需要結合業務和專家經驗進行判斷。
責任編輯:xj

原文標題:AI加持下的互聯網反欺詐 | 反欺詐AI全域治理三部曲(中)

文章出處:【微信公眾號:芯盾時代】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 互聯網
    +關注

    關注

    54

    文章

    11113

    瀏覽量

    103024
  • AI
    AI
    +關注

    關注

    87

    文章

    30212

    瀏覽量

    268453

原文標題:AI加持下的互聯網反欺詐 | 反欺詐AI全域治理三部曲(中)

文章出處:【微信號:trusfort,微信公眾號:芯盾時代】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    射頻分析儀的技術原理和應用場景

    分析儀的應用場景射頻分析儀在多個領域具有廣泛的應用,主要包括以下幾個方面: 無線通信:射頻分析儀在無線通信領域具有廣泛的應用前景。隨著5G、物聯網等新一代信息技術的快速發展,無線通信網絡的復雜
    發表于 11-26 14:32

    一致測試系統的技術原理和也應用場景

    有效手段。 綜上所述,一致測試系統的技術原理和應用場景都非常廣泛和深入,在通信協議、網絡設備和系統的驗證以及企業系統數據校驗等方面發揮著重要
    發表于 11-01 15:35

    源測量單元設備的技術原理和應用場景

    ,SMU的功能和應用領域也在不斷擴展,其在電子測試中的重要性不言而喻。綜上所述,SMU設備憑借其獨特的技術原理和廣泛的應用場景,在現代電子測試中發揮著不可或缺的作用。對于工程師來說,深入了解和靈活應用SMU將是提升電路板測試效果
    發表于 10-22 11:10

    工業工程軟件在企業導入中的重要性必要性

    在全球化競爭加劇、市場需求瞬息萬變的今天,企業為了保持競爭力,需要不斷優化生產流程、提高生產效率、降低成本并保障產品質量。而工業工程軟件作為一種強大的工具,其在企業導入中的重要性必要性日益凸顯
    的頭像 發表于 10-18 11:09 ?183次閱讀

    超聲波測厚儀的技術原理和應用場景

    測厚儀還可應用于陶瓷加工、玻璃制造、管道防腐等領域,其廣泛的應用范圍體現了其在工業生產、質量控制和安全檢測等方面的重要性。綜上所述,超聲波測厚儀以其獨特的技術原理和廣泛的應用場景,成為了工業檢測領域中不可或缺的
    發表于 09-27 15:06

    NFC協議分析儀的技術原理和應用場景

    的安全,并提出相應的防護措施和改進建議。 綜上所述,NFC協議分析儀在移動支付、門禁系統、智能標簽識別、物聯網設備控制以及安全分析等領域都有廣泛的應用場景。它能夠幫助用戶快速準確地分
    發表于 09-25 14:45

    無人機主動防御系統的必要性重要性

    的安全性問題也日益凸顯,無人機的非法入侵、惡意攻擊等行為給人們的生活和國家安全帶來了嚴重威脅。因此,研究無人機主動防御系統的必要性重要性具有十分重要的現實意義。 二、無人機的安全隱患 非法入侵 無人機的非法入
    的頭像 發表于 07-08 09:45 ?596次閱讀

    求助,ADC接地的重要性

    ADC接地的重要性
    發表于 06-04 07:56

    論RISC-V的MCU中UART接口的重要性

    的適用重要性。在某些應用場景中,只需要異步通信能力的UART接口就能滿足需求,從而簡化了系統設計和實現。 綜上所述,RISC-V的MCU中UART接口的重要性在于其廣泛的適用
    發表于 05-27 15:52

    能源互聯網平臺的功能和應用場景

    能源革命,為建筑樓宇、工業企業、建筑社區、工業園區、城市區域等五大應用場景,包括綜合能源、智慧電力、智慧燃氣、智慧熱力、空調冷熱、工藝冷熱等20多個項目類型提供可靠的物聯網支持。 通過數之能推出的能源互聯網云平
    的頭像 發表于 03-18 17:27 ?435次閱讀

    集成芯片的重要性必要性

    集成芯片在現代科技和工業中占據著至關重要的地位,其重要性必要性主要體現在以下幾個方面。
    的頭像 發表于 03-18 15:17 ?1026次閱讀

    NanoEdge AI的技術原理、應用場景及優勢

    能耗并提高數據安全。本文將對 NanoEdge AI 的技術原理、應用場景以及優勢進行綜述。 1、技術原理 NanoEdge AI 的核心技術
    發表于 03-12 08:09

    PLC網關的重要性

    PLC網關的重要性 可編程邏輯控制器(PLC)作為現代工業自動化領域的核心設備,廣泛應用于各種自動化控制系統。隨著工業物聯網(IIoT)技術的發展,PLC網關成為了連接傳統PLC系統和現代工業物
    的頭像 發表于 01-30 15:50 ?542次閱讀
    PLC網關的<b class='flag-5'>重要性</b>

    工業互聯網解決方案與應用場景

    ,工業互聯網的應用也面臨著諸多挑戰,數之能提供高效可靠的工業互聯網解決方案,幫助企業更好的面對工業互聯網應用及其挑戰。 1、智能制造 智能制造是工業互聯網應用的
    的頭像 發表于 01-26 11:00 ?608次閱讀

    何謂正確去耦?有何必要性

    電子發燒友網站提供《何謂正確去耦?有何必要性?.pdf》資料免費下載
    發表于 11-30 09:25 ?0次下載
    何謂正確去耦?有何<b class='flag-5'>必要性</b>?