【導(dǎo)語(yǔ)】隨著機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的不斷發(fā)展,相關(guān)技術(shù)在越來(lái)越多的領(lǐng)域得到了應(yīng)用,機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)和其他學(xué)科的結(jié)合已經(jīng)成為了必然趨勢(shì)。在本文中,我們給大家分享了一個(gè)包含機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)技術(shù)在工業(yè)界開源應(yīng)用的 Github 項(xiàng)目,具體領(lǐng)域包括會(huì)計(jì)、銀行和保險(xiǎn)業(yè)務(wù)、法律和法規(guī)、政府和公共政策等等。該項(xiàng)目仍在持續(xù)更新中。
隨著機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)技術(shù)的不斷發(fā)展,在工業(yè)界出現(xiàn)了越來(lái)越多的相關(guān)技術(shù)應(yīng)用,學(xué)科交叉已經(jīng)成為必然趨勢(shì)。
在今天的分享中,營(yíng)長(zhǎng)為大家選取了一個(gè)來(lái)自GitHub的項(xiàng)目,該項(xiàng)目整理了機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)在工業(yè)界的落地應(yīng)用,應(yīng)用領(lǐng)域包括會(huì)計(jì)、銀行和保險(xiǎn)業(yè)務(wù)、法律和法規(guī)、政府和公共政策等領(lǐng)域。在該項(xiàng)目中,除非特別注明,作者分享的大部分項(xiàng)目都基于 Python 。另外,為了使得項(xiàng)目代碼更具參考性,該項(xiàng)目列表沒有包含明確聲明“不再更新”或者已超出2年未更新的相關(guān)項(xiàng)目。
先為大家梳理了一下該項(xiàng)目的相關(guān)內(nèi)容,以便大家快速查看。如果希望進(jìn)一步了解相關(guān)內(nèi)容,可查看文末的 GitHub 項(xiàng)目地址。
在該項(xiàng)目中,作者嘗試對(duì)機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)在工業(yè)界的具體應(yīng)用情況進(jìn)行匯總,預(yù)計(jì)包含的領(lǐng)域如下表:
目前,作者已經(jīng)整理了會(huì)計(jì)、銀行和保險(xiǎn)業(yè)務(wù)、法律和法規(guī)、政府和公共政策四個(gè)領(lǐng)域的相關(guān)開源項(xiàng)目情況,并進(jìn)行了歸納和匯總。對(duì)于每個(gè)領(lǐng)域,作者對(duì)相關(guān)資源進(jìn)行了分類和項(xiàng)目匯總,并給出了每個(gè)項(xiàng)目的鏈接和簡(jiǎn)短介紹。該項(xiàng)目列表仍在持續(xù)更新中。
領(lǐng)域:會(huì)計(jì)
作者將會(huì)計(jì)相關(guān)的應(yīng)用劃分為7類,包括機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、文本分析、數(shù)據(jù)獲取與處理、相關(guān)研究和文章、網(wǎng)站、課程。下面對(duì)各部分進(jìn)行分別介紹。
機(jī)器學(xué)習(xí)
1.Chartof Account Prediction:使用帶標(biāo)簽的數(shù)據(jù)集預(yù)測(cè)每筆交易的賬戶名稱。
2.AccountingAnomalies:使用深度學(xué)習(xí)框架識(shí)別會(huì)計(jì)信息中的異常。
3.FinancialStatement Anomalies:基于 R語(yǔ)言,在會(huì)計(jì)文件歸檔前檢測(cè)會(huì)計(jì)異常信息。
4.UsefulLife Prediction:使用傳感器數(shù)據(jù)和特征工程預(yù)測(cè)資產(chǎn)的可使用年限。
5.AI Applied to XBRL:將可擴(kuò)展商業(yè)報(bào)告語(yǔ)言(XBRL)用于 AI 和機(jī)器學(xué)習(xí)。
數(shù)據(jù)分析
1.ForensicAccounting:包含使用數(shù)據(jù)分析手段進(jìn)行法務(wù)會(huì)計(jì)的案例研究集合。
2.GeneralLedger:對(duì)會(huì)計(jì)系統(tǒng)中的總賬進(jìn)行數(shù)據(jù)處理。
3.BulletGraph:以子彈圖(bullet graph)形式對(duì)銷售、委托及其他會(huì)計(jì)活動(dòng)進(jìn)行可視化。
4.AgedDebtors:對(duì)長(zhǎng)期債務(wù)人的案例分析。
5.AutomatedFS XBRL:自動(dòng)生成 XBRL ,也可使用 python 格式輸出。
文本分析
1.FinancialSentiment Analysis:對(duì)交易信息進(jìn)行情感分析、距離分析和交易份額分析。
2.Extensive NLP:針對(duì)會(huì)計(jì)研究的 NLP 技術(shù)匯總。
數(shù)據(jù),句法分析和 APIs
1.EDGAR:獲取電子化數(shù)據(jù)收集、分析及檢索系統(tǒng)(EDGAR)數(shù)據(jù)的指南。
2.IRS:獲取美國(guó)國(guó)家稅務(wù)局(IRS)歸檔數(shù)據(jù)并進(jìn)行句法分析的指南。
3.FinancialCorporate:羅格斯大學(xué)提供的金融數(shù)據(jù)集
4.Non-financialCorporate:羅格斯大學(xué)提供的非金融公司數(shù)據(jù)集
5.PDFParsing:從 PDF 文件中抽取有用信息
6.PDFTabel to Excel:從 PDF 文件中輸出表格
研究和文章
1.UnderstandingAccounting Analytics:介紹了會(huì)計(jì)分析的重要性。
2.VLFeat:一個(gè)計(jì)算機(jī)視覺算法的開源庫(kù),并且提供了 Matlab 工具。
網(wǎng)站
1.RutgersRaw:羅格斯大學(xué)的數(shù)字會(huì)計(jì)研究
課程
1.ComputerAugmented Accounting:羅格斯大學(xué)的系列視頻課程,主要講解如何將計(jì)算機(jī)手段應(yīng)用到會(huì)計(jì)中。
2.Accountingin a Digital Era:羅格斯大學(xué)的系列視頻課程,主要講解數(shù)字時(shí)代對(duì)會(huì)計(jì)的影響。
領(lǐng)域:銀行和保險(xiǎn)業(yè)
作者將該領(lǐng)域歸納為7部分內(nèi)容,包括消費(fèi)經(jīng)濟(jì)、管理、評(píng)估、欺詐、保險(xiǎn)業(yè)及其風(fēng)險(xiǎn)、物質(zhì)基礎(chǔ)、數(shù)據(jù)。下面進(jìn)行分別介紹。
消費(fèi)金融
1.LoanAcceptance:對(duì)借貸成功率的分類和時(shí)序分析。
2.PredictLoan Repayment:使用自動(dòng)特征工程預(yù)測(cè)貸款是否會(huì)被歸還
3.LoanEligibility Ranking:檢驗(yàn)消費(fèi)者是否具有貸款資質(zhì)的系統(tǒng)
4.HomeCredit Default:預(yù)測(cè)家庭信用違約
5.MortgageAnalytics:對(duì)按揭貸款的擴(kuò)展分析
6.CreditApproval:輔助信用卡辦理申請(qǐng)批準(zhǔn)的系統(tǒng)
7.LoanRisk:通過(guò)預(yù)測(cè)模型降低壞賬率,減小貸款損失
8.Amortisationschedule:用于個(gè)人使用的自動(dòng)分期付款計(jì)劃
管理
1.CreditCard:對(duì)信用卡消費(fèi)者進(jìn)行顧客終生價(jià)值(CLV)評(píng)估
2.SurvivalAnalysis:對(duì)顧客進(jìn)行生存分析
3.NextTransaction:使用深度學(xué)習(xí)模型預(yù)測(cè)下一次交易的金額和時(shí)間
4.CreditCard Churn:預(yù)測(cè)信用卡顧客流失
5.Bankof England Minutes:對(duì)英國(guó)銀行記錄的文本分析
評(píng)估
1.ZillowPrediction:預(yù)測(cè) Zillow 公司提供的估價(jià)情況
2.RealEstate:評(píng)估城市地區(qū)的地產(chǎn)價(jià)格
3.UsedCar:二手車價(jià)格預(yù)測(cè)
欺詐
1.XGBoost:使用模擬退火算法調(diào)整 XGBoost 超參數(shù)以預(yù)測(cè)欺詐行為
2.FraudDetection loan in R:對(duì)銀行借貸的欺詐預(yù)測(cè)
3.AMLFinance Due Diligence:使用新聞進(jìn)行反洗錢盡職調(diào)查
4.CreditCard Fraud:預(yù)測(cè)信用卡欺詐行為
保險(xiǎn)業(yè)及其風(fēng)險(xiǎn)
1.BankFailure:對(duì)銀行破產(chǎn)進(jìn)行預(yù)測(cè)
2.RiskManagement:關(guān)于金融業(yè)風(fēng)險(xiǎn)參與的課程資源
3.VaRGaN:使用 Keras 和 Tensorflow 評(píng)估市場(chǎng)風(fēng)風(fēng)險(xiǎn)參與情況
4.ActuarialSciences (R):基于 R 語(yǔ)言的精算工具列表
物質(zhì)基礎(chǔ)
1.BankNote Fraud Detection:使用Tensorflow 和隨機(jī)森林對(duì)紙幣進(jìn)行鑒定
2.ATMSurveillance:銀行 ATM 監(jiān)控
數(shù)據(jù)
1.EmployeeCount SEC Filings
2.SECParsing
3.OpenEdgar
4.RatingIndustries
法律法規(guī)
在該部分,作者介紹了3部分內(nèi)容的相關(guān)應(yīng)用,包括工具、政策和法規(guī)、司法應(yīng)用。
工具
1.LexPredict:一個(gè)相關(guān)的代碼庫(kù)
2.AIPara-legal: AI 法律助理
3.LegalEntity Detection:對(duì)法律文件的命名實(shí)體識(shí)別
4.LegalCase Summarisation:對(duì)司法判例進(jìn)行文摘的多種算法匯總
5.LegalDocuments Google Scholar:使用 Google scholar 自動(dòng)抽取判例
6.ChatBot:法律領(lǐng)域的聊天機(jī)器人和郵件通知應(yīng)用
政策和法規(guī)
1.GDPRscores:依據(jù)通用數(shù)據(jù)保護(hù)條例(GDPR)對(duì)法律文件的評(píng)分進(jìn)行預(yù)測(cè)
2.DrivingFactors FINRA:對(duì)美國(guó)金融監(jiān)管局(FINRA)發(fā)布限制令的影響因素分析
3.SecuritiesBias Correction:安全法規(guī)對(duì)價(jià)格影響的估計(jì)
4.PublicFirm to Legal Decision:分析上市公司對(duì)法律政策的反應(yīng)
司法方面的應(yīng)用
1.SuremeCourt Prediction:預(yù)測(cè)最高法院的觀念立場(chǎng)
2.SupremeCourt Topic Modeling:對(duì)最高法院的決定進(jìn)行主題挖掘
3.JudgeOpinion:使用文本分析方法和機(jī)器學(xué)習(xí)分析法官針對(duì)某議題的觀點(diǎn)
4.ML LawMatching:使用機(jī)器學(xué)習(xí)匹配案例相關(guān)法律條例
5.BertMulti-label Classification:使用 AI 進(jìn)行細(xì)粒度情感分析
6.SomeComputational AI Course:MIT的相關(guān)視頻課程
領(lǐng)域:政府和公共政策
在該部分,作者介紹了5部分內(nèi)容,包括社會(huì)政策、選舉分析、災(zāi)難管理、城市規(guī)劃、設(shè)施。
社會(huì)政策
1.Triage:對(duì)政策和公共利益問(wèn)題的風(fēng)險(xiǎn)建模和預(yù)測(cè)工具
2.WorldBank Poverty I:對(duì)用于貧困預(yù)測(cè)的機(jī)器學(xué)習(xí)分類算法的比較優(yōu)勢(shì)分析
3.WorldBank Poverty II:基于世界銀行數(shù)據(jù)的貧困分析
4.OverseasCompany Land Ownership:分析英國(guó)的外企情況
5.CFPB:美國(guó)消費(fèi)者權(quán)益保護(hù)局(CFPB)的投訴分析
6.CannabisLegalisation Effect:關(guān)于大麻制品的法規(guī)對(duì)犯罪活動(dòng)的影響分析
選舉分析
1.ElectionAnalysis:選舉分析和預(yù)測(cè)模型
2.AmericanElection Causal:使用美國(guó)國(guó)家選舉研究所(ANES)的數(shù)據(jù)構(gòu)建因果推斷模型
3.CampaignFinance and Election Results:對(duì)競(jìng)選經(jīng)費(fèi)和后續(xù)選舉結(jié)果間關(guān)系分析
災(zāi)難管理
1.ConflictPrediction:沖突預(yù)測(cè)的相關(guān)代碼
2.BurglaryPrediciton:構(gòu)建時(shí)空模型以預(yù)測(cè)入室盜竊
3.PredictiongDisease Outbreak:基于機(jī)器學(xué)習(xí)算法的相關(guān)應(yīng)用
4.Roadaccident prediction:對(duì)巴西的聯(lián)邦公路的車禍分析
5.Text Mining:使用文本挖掘進(jìn)行災(zāi)難管理
6.Twitterand disasters:預(yù)測(cè) twitter是否涉及災(zāi)難事件
城市規(guī)劃
1.TrafficPrediction:使用多注意力機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò)模型對(duì)城市交通
進(jìn)行時(shí)序分析
2.PredictCrashes:使用多數(shù)據(jù)來(lái)源的車禍預(yù)測(cè)模型
3.PredictHousehold Poverty:使用自動(dòng)特征工程對(duì)哥斯達(dá)黎加的家庭貧困情況進(jìn)行預(yù)測(cè)
設(shè)施
1.AirQuality Prediction:預(yù)測(cè)北京和倫敦在未來(lái)48小時(shí)的空氣質(zhì)量
2.WaterAccountng: 對(duì)美國(guó)的水費(fèi)預(yù)算進(jìn)行預(yù)測(cè)
3.ElectrcityFrench Distribution:對(duì)法國(guó)的電力數(shù)據(jù)分布進(jìn)行分析
以上就是今天的分享,希望對(duì)大家有所幫助。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8377瀏覽量
132407 -
GitHub
+關(guān)注
關(guān)注
3文章
466瀏覽量
16386 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
165瀏覽量
10045
原文標(biāo)題:機(jī)器學(xué)習(xí)在金融、法律等領(lǐng)域的技術(shù)應(yīng)用 | Github推薦
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論