精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用RAPIDS生成用于加速短期價格預測的限價訂單簿數據集

jf_pJlTbmA9 ? 來源:NVIDIA ? 作者:NVIDIA ? 2023-07-05 16:30 ? 次閱讀

做市商是賣方的主要參與者,為市場提供流動性。投機者站在買方一邊,進行實驗和研究,希望從中獲利。最終用戶是向零售經紀人咨詢建議和交易的散戶投資者。總體而言,金融公司有興趣評估金融機器學習( ML )算法,以發現哪些算法最有利可圖。

研究人員最近發表了許多版本的這種類型的算法。我們試圖利用高頻數據和隨機森林( RF )模型的可解釋性,并選擇了本文中提出的 RF 方法研究短期價格預測的限價訂單簿特征:一種機器學習方法.

我們的研究發現,使用 GPU硬件加速減少了金融 ML 研究人員獲得預測結果所需的時間。由于大部分運行時間都可以用于分類器訓練,因此人們當然對更有效的訓練方法感興趣。

本文介紹了我們的研究,包括生成的數據集,使用限價訂單簿( LOB )數據進行價格預測,以及 ML 訓練的推薦步驟。我們解釋了所研究的 GPU 配置如何顯著加快 ML 訓練時間,從而實現更高效和更廣泛的模型開發

數據集

本研究使用顯示實時股價的時間序列數據集來更好地理解 LOB 結構和方向預測。市場數據公司提供Intrinio,本研究的數據集包含紐約證券交易所和納斯達克股票代碼的實際市場價格樣本,以 1 秒為基礎,來自道瓊斯 30 指數股票。

1 秒的報價被用作 ABIDES (基于代理的交互式離散事件模擬)的輸入,以生成看起來像市場 LOB 的 LOB 數據。每條記錄上的時間戳都在第二個標記處;例如: 2019 年 1 月 2 日的 2019-01-02T14 : 09 : 18Z ,即 2019 年的第一個交易日

輸入到 ABIDES 的 CSV 文件由這一列作為第一列,后面是 30 列 DOW 30 的美元價格(到兩位數)。本文將 AAPL 股票行情作為一個測試案例。

使用 ABIDES 生成合成數據

ABIDES 是一種模擬金融市場運作的方法。在最近的論文中進行了解釋,ABIDES: Towards High-Fidelity Multi-Agent Market Simulation,由佐治亞理工學院、佐治亞大學和摩根大通銀行的研究人員撰寫

ABIDES 模擬了許多通過交易所代理買賣資產的個人交易代理。模擬中的每一筆交易和其他事件都會被記錄下來,并與執行交易的代理人聯系在一起。這使市場研究人員能夠詳細分析不同的代理人策略和事件如何影響模擬市場。重要的是,給定交換的 LOB 可以在模擬之后重建

ABIDES 模擬中的一些代理基于時間序列來評估資產,該時間序列表示代理在某個頻率下觀察到的資產的真實價值,并添加一些噪聲。這個時間序列被稱為基本價值股票的價格。為了在宏觀尺度上模擬一個更現實的市場,我們使用真實的歷史數據作為基本值。

為了創建合理的 LOB 數據來訓練我們的 RF 模型,我們使用 Intrinio 提供的 1 秒報價作為 ABIDES 模擬的歷史基本值。圖 1 將輸出 LOB 數據的中間價與用作 AAPL 歷史基本面的 1 秒報價進行了比較。

chart-aapl-data-abides-simulation-comparison.png 圖 1 。將 Intrinio 的 1 秒輸入 AAPL 報價數據(藍線)與單個交易日輸出 ABIDES 模擬的中間價(黑線)進行比較的圖表

LOB 作為短期價格變動的預測指標

在貿易交易的投標方,買方希望盡可能少地支付購買給定證券的費用。在要求方,賣方希望以盡可能高的價格出售證券。限價單是在買賣雙方設定這些限制的一種方式。

給定證券的 LOB 是一個訂單大小列表, x 軸為證券價格, y 軸為該價格下買賣雙方的總交易量。例如,買家愿意以每股 580 美元的價格購買 100 股谷歌證券,因此出售者必須有足夠的股份來完成這 100 股。請參見圖 2 以獲取 LOB 示例。

LOB 分為出價部分(圖 2 中紅線左側)和要價部分(圖 2 紅線右側),前者的價格低于中間市場,后者的價格較高。

limit-order-book-snapshot-goog-security.png 圖 2 :將 GOOG 安全的訂單簿快照限制在相隔 292 微秒的兩個時間點。訂單量顯示在 y 軸上,價格顯示在 x 軸上。中間報價由買賣盤之間的紅線標記。

簡單地說,買方希望在市場上支付更低的價格,而賣方希望獲得更高的價格。時間點在小數點后有九位數,這反映了現代證券交易所的納秒精度

兩個框架中的第一個框架(位于圖 2 頂部)的一個顯著特征是,從高點(高于標記為 5 . 80 的點)可以看出,以 580 美元的價格出售的需求量很大。觀察這是如何主導 LOB 的,預示著中間報價向右移動,美元價值更高。

圖 3 顯示,當向分類器提供更多的 LOB 深度時,預測價格走勢即時方向的準確性會提高。這是直觀的,因為分類器在訓練過程中有更多關于市場兩側的可用信息(出價水平和要價水平)。

lob-depth-accuracy-comparison.png 圖 3 。限制訂單簿深度可能會有所不同。 ML 中間價格方向預測的準確性在書中有更多級別時更加穩健
圖片來源:費薩爾·庫雷希

使用 RAPIDS 加速隨機森林訓練

我們訓練了一個隨機森林模型,以 LOB 數據作為輸入來預測短期價格走勢。我們訓練了一個分類器來預測給定的股價是向上、向下還是持平

具體來說,目標是預測未來 20 個中間價格( m下一個) 將小于或大于之前 20 個中間價格的平均值( m上一個) 以一定的幅度。我們將這一差額定義為 0 . 5 美分,這是我們數據集中任何兩個 LOB 幀之間中間價格的最小非零差異。

標簽為 2 表示價格上漲( m下一個–米上一個> 0 . 5 美分),標簽為 1 表示中性價格變動,標簽為 0 表示向下價格變動( m下一個–米上一個< -0 . 5 美分)

以下實驗是在一個NVIDIA A100用于 RAPIDS cuDF 和 RAPIDS cuML 的 80 GB SXM ,以及用于 scikit learn 和 pandas 的兩個 AMD EPYC 7742 64 核處理器。使用 RAPIDS cuDF 庫和 pandas 計算中間價、平均值和標簽

圖 4 顯示了運行時的比較。平均預處理時間是根據每種配置的 10 次運行和 10 次預熱計算得出的。這是在 ML 訓練運行之前的一個標記步驟,如圖 5 所示。

mean-preprocessing-time-seconds.png 圖 4 。 CPU 與 pandas 以及 GPU 與 cuDF 的平均預處理時間的比較

我們使用 scikit learn 和 RAPIDS cuML 訓練了一個由 100 棵樹組成的隨機森林分類器,并比較了兩者的訓練時間。 RAPIDS cuML 是 scikit learn 的免費替代品,它使許多流行的 ML 算法能夠在 GPU 上加速

圖 5 顯示了一個 NVIDIA A100 80 GB 與 RAPIDS cuML 以及兩個 AMD EPYC 7742 64 核處理器與 scikit learn 上訓練工作負載的運行時間的比較。 CPU 上的訓練是多線程的,有 128 個線程,使用 scikit learnn_jobs參數

五次熱身的平均時間是 50 分以上,而 scikit 的學習時間是五次熱身平均 10 分以上。使用 GPU 進行訓練的速度大約快 10 倍。這些結果與 2022 年 GPU 研究結果一致,詳見Accelerating Machine Learning Training Time for Limit Order Book Prediction.

training-runtime-seconds-scitkit-learn-and-cuml.png 圖 5 。 scikit 在 CPU 上學習和在 GPU 上學習的訓練運行時間(秒)

GPU 上的培訓可為這一工作量提供 10 倍以上的加速。 ML 分類器開發的迭代性質使其時間密集,特別是考慮到金融市場中使用的大量時間序列數據。簡而言之, GPU 是 ML 算法研究的游戲規則改變者。

金融數據集日益增長的計算需求

雖然前面的例子使用了一個股票行情器,但這些高頻交易和限價訂單的用例需要多個 AI 系統運行相當于多個的算法NVIDIA DGX SuperPODs通常,專門研究此類用例的組織需要多個資產類和跟蹤器

因此,這種算法的分析和應用可以很容易地并行化,案例可以擴展到需要加速時間和大量計算的多個人工智能系統。例如,定量金融、機器學習(如 RAPIDS cuML )和深度學習應用(如 LOB 數據集之上的神經網絡)。

為了在開發金融 ML 算法時加快培訓速度,您可以使用 RAPIDS 庫套件來利用 GPU 加速:

RAPIDS cuDF 取代 pandas Python

RAPIDS cuML 取代 scikit 學習 Python 庫

下載并安裝 RAPIDS開始為您的數據科學工作負載啟用 GPU 。記得事先安裝 NVIDIA 驅動程序和 CUDA 工具包。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4940

    瀏覽量

    102815
  • 人工智能
    +關注

    關注

    1791

    文章

    46859

    瀏覽量

    237567
  • 機器學習
    +關注

    關注

    66

    文章

    8377

    瀏覽量

    132409
收藏 人收藏

    評論

    相關推薦

    TF之CNN:CNN實現mnist數據預測

    TF之CNN:CNN實現mnist數據預測 96%采用placeholder用法+2層C及其max_pool法+隱藏層dropout法+輸出層softmax法+目標函數cross_entropy法+
    發表于 12-19 17:02

    高效簡潔的labview讀取excel工作簿信息

    讀取excel工作簿的傳統方法是自動化引用進行數據讀取操作。但是自動化引用鏈路較長,且由于Microsoft offer版本問題導致部分用戶找不到Excel._Application。這里給出一種
    發表于 04-11 18:24

    期價格高價回收西門子輸入輸出模塊

    期價格高價回收西門子輸入輸出模塊、高價回收西門子 PLC CPU. 工程余貨.個人閑置。6ES系列。6SE7系列。6DD系列。6FC系列。6GK系列。6SN系列。6AV觸摸屏系列。有意者私聊。誠信
    發表于 06-11 17:13

    光伏功率預測系統的構成和作用

      光伏功率預測是什么?光伏功率預測系統就是將天氣預報數據和環境檢測儀所采集的數據加以分析,最后將生成
    發表于 01-18 16:10

    開發和設計實現LSTM模型用于家庭用電的多步時間序列預測相關資料分享

    短期記憶遞歸神經網絡能夠自動學習序列數據的特征,支持多變量數據,并且可以輸出可用于多步預測的可變長度序列。總體概述本教程分為九個部分; 他們
    發表于 07-05 06:43

    什么是有限模型預測控制

    用于電壓型逆變器饋電的永磁同步電機驅動系統中。有限模型預測控制在當前控制周期內對每個開關狀態所產生的電機輸出結果進行預測,將預測結果與所
    發表于 08-27 06:05

    基于卡爾曼濾波的電力系統短期負荷預測

    首先介紹了卡爾曼濾波的算法,并給出了一套遞推計算公式,然后將此算法應用于短期負荷預測,并針對負荷預測的本身的特點對算法進行了改進,兩種算法
    發表于 07-11 18:44 ?1223次閱讀
    基于卡爾曼濾波的電力系統<b class='flag-5'>短期</b>負荷<b class='flag-5'>預測</b>

    LSSVM短期負荷預測模型

    短期負荷預測的精度直接影響電力系統運行的可靠性和供電質量。提出一種基于粒子群優化算法的最小二乘支持向量機短期負荷預測的模型和算法,對最小二乘支持向量機的參數尋優,再以測試
    發表于 03-30 14:55 ?4次下載

    NVIDIA推出RAPIDS開源GPU加速平臺

    HPE、IBM、Oracle、開源社區、創業公司采用RAPIDS,顯著提升端到端預測數據分析能力。
    的頭像 發表于 10-17 14:36 ?4298次閱讀

    華為開發者大會2021 OpenHarmony中短期價

    今天的華為開發者大會2021上,OpenHarmony分論壇上展示了OpenHarmony中短期價值 。 HDC分論壇-OpenHarmony 分論壇推薦鏈接:http://t.elecfans.com/live/1708.html 責任編輯:haq
    的頭像 發表于 10-23 17:19 ?1449次閱讀
    華為開發者大會2021 OpenHarmony中<b class='flag-5'>短期價</b>值

    具有RAPIDS cuML的GPU加速分層DBSCAN

      我們將通過快速示例演示 HDBSCAN 的 RAPIDS cuML 實現中當前支持的功能,并將提供我們在 GPU 上實現的一些實際示例和基準。在閱讀了這篇博文之后,我們希望您對 RAPIDS ‘ GPU – 加速 HDBSC
    的頭像 發表于 04-18 16:15 ?4054次閱讀
    具有<b class='flag-5'>RAPIDS</b> cuML的GPU<b class='flag-5'>加速</b>分層DBSCAN

    如何使用RAPIDS和CuPy時加速Gauss 秩變換

      高斯秩變換 是一種新的標準化技術,用于轉換輸入數據以訓練深層神經網絡。最近,我們在 預測分子競爭性質 中使用了這種技術,它很容易將 m 消息傳遞神經網絡模型 的精度提高了一個顯著的幅度。這篇博文
    的頭像 發表于 04-20 10:37 ?1578次閱讀
    如何使用<b class='flag-5'>RAPIDS</b>和CuPy時<b class='flag-5'>加速</b>Gauss 秩變換

    NVIDIA RAPIDS加速器v21.08的功能應用

      我們通過處理 GPU 內存溢出的數據以進行分組和窗口操作,繼續改善用戶體驗。這一改進將節省用戶創建分區的時間,以避免 GPU 上出現內存不足錯誤。類似地, UCX 1.11 的采用改進了 RAPIDS Spark
    的頭像 發表于 04-20 14:58 ?1483次閱讀
    NVIDIA <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>器v21.08的功能應用

    通過RAPIDS加速單細胞DNA和RNA基因組分析

    使用 RAPIDS 生成這個 UMAP 可視化需要 1 秒,而在 CPU 上則需要 80 秒。事實上, RAPIDS 可以加速整個單單元分析工作流程,甚至可以在大型
    的頭像 發表于 04-27 16:14 ?1218次閱讀
    通過<b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>單細胞DNA和RNA基因組分析

    使用 RAPIDS 進行更快的單細胞分析

    使用 RAPIDS-singlecell 進行 GPU 加速的單細胞 RNA 分析
    的頭像 發表于 07-05 16:30 ?665次閱讀
    使用 <b class='flag-5'>RAPIDS</b> 進行更快的單細胞分析