人工智能賦能的數據管理、分析與系統專刊前言
來源:《軟件學報》,作者李戰懷等
大數據時代,數據規模龐大,數據管理應用場景復雜,傳統數據庫和數據管理技術面臨很大的挑戰.人工智能技術因其強大的學習、推理、規劃能力,為數據庫系統提供了新的發展機遇.專刊強調數據管理與人工智能的深度融合,研究人工智能賦能的數據庫新技術和新型系統,包括兩方面:(1)傳統數據管理、數據分析技術及系統與人工智能相結合,將會煥發新的生機;(2)大數據管理與分析是新一代人工智能技術發展的基石.因此,圍繞傳統數據管理的不同技術層面,需要新的理論和系統經驗.專刊重點圍繞數據庫核心技術,探討數據管理與人工智能的深度融合,探討在人工智能大潮下,傳統數據管理技術、數據分析技術與數據庫系統受到的影響、契機與應對策略,通過數據管理與人工智能融合,重點關注人工智能賦能新技術對傳統數據采集、數據存儲、索引、查詢、統計分析以及數據管理系統的促進和提升.
本專刊論文均通過了形式審查,內容涉及人工智能賦能的數據管理、分析與系統.特約編輯先后邀請了 60 多位專家參與審稿工作,最終有18 篇論文入選本專刊.根據主題,這些論文可以分為5 組.
(1)人工智能賦能的數據管理技術
《人工智能賦能的數據管理技術研究》綜述人工智能賦能的數據管理新技術的研究進展,總結了現有方法的問題和解決思路,并對未來研究方向進行展望.
《基于中間層的可擴展學習索引技術》提出了基于中間層的可擴展學習型索引模型Dabble,從而解決索引更新引發的模型重訓練問題.
《面向關系數據庫的智能索引調優方法》提出一種面向關系數據庫系統的智能索引調優技術,利用機器學習方法構造索引的量化模型,可以準確地對索引的查詢優化效果進行估計,并設計了一種高效的最優索引選擇算法,實現了快速的從候選索引空間中選擇滿足給定大小約束的最優的索引組合.
《基于時空相關屬性模型的公交到站時間預測算法》提出一種基于深度神經網絡的公交到站時間預測算法,采用時空組件、屬性組件和融合組件預測公交車輛從起點站到終點站的總時長.
(2)數據處理與優化技術
《面向數據特征的內存跳表優化技術》給出條件社區搜索問題的形式化定義,使用布爾表達式表示搜索條件,提出解決條件社區搜索問題的通用框架及其優化方法,將條件社區搜索分解為多個單項條件社區搜索.
《面向區塊鏈的高效物化視圖維護和可信查詢》提出一種面向區塊鏈的高效物化視圖機制,將視圖維護操作與共識過程同時執行,降低該操作對系統性能的影響;使用字典樹加快以區塊為單位的多物化視圖維護進程;以默克爾驗證的方式確保物化結果不被惡意篡改,進而確保查詢結果可信.
《時間約束的實體解析中記錄對排序研究》提出基于二分圖上相似性傳播的記錄匹配可能性計算方法,將記錄對、塊及其關聯關系構建二分圖;相似性沿著二分圖不斷地在記錄對結點與塊結點之間傳播,直到收斂.收斂結果可以通過不動點計算得到.提出了近似的收斂計算方法來降低計算代價,從而保證實體解析的實時召回率
(3)人工智能賦能的數據分析與推薦
《面向多維稀疏數據倉庫的欺詐銷售行為挖掘》提出基于分割率的特征提取方法和基于張量重構的掛單行為挖掘算法;設計了基于掛單模式偏序格的特征提取方法,對銷售數據集中存在的掛單行為進行分類.
《基于相關性分析的工業時序數據異常檢測》提出一種基于序列相關性分析的多維時間序列異常檢測方法.對多維時間序列進行分段、標準化計算,得到相關性矩陣,提取量化的相關關系.然后,建立了時序相關圖模型,通過在時序相關圖上的相關性強度,劃分時間序列團,進行時間序列團內、團間以及單維的異常檢測.
《基于圖神經網絡的動態網絡異常檢測算法》提出了基于圖神經網絡的異常檢測算法,將圖結構、屬性,以及動態變化的信息引入模型中,以學習進行異常檢測的表示向量.
《融合選擇提取與子類聚類的快速Shapelet 發現算法》提出一種快速時間序列Shapelet 發現算法,通過對原始訓練集采用時間序列聚類,可以得到原始時間序列中沒有的Shapelet,同時在選擇性提取算法中加入投票機制,以解決產生Shapelet 過多的問題.
《基于注意力機制的規范化矩陣分解推薦算法》提出一種基于注意力機制的規范化矩陣分解模型,依據用戶信任網絡和評分記錄構建用戶-項目異構網絡,并構建用戶間的相似關系;引入注意力機制分析用戶對項目各個屬性特征不同的關注度來獲取更準確的用戶偏好.
《融合顯式反饋與隱式反饋的協同過濾推薦算法》提出一種融合顯式反饋與隱式反饋的協同過濾推薦算法.利用加權低秩近似處理隱式反饋數據,訓練出隱式用戶/物品向量;引入基線評估,將隱式用戶/物品向量作為補充,通過顯隱式用戶/物品向量結合,訓練得出用戶對物品的預測偏好程度.
(4)人工智能賦能的數據庫系統
《學習式數據庫系統:挑戰與機遇》提出一種細粒度的分類體系,從數據庫架構出發,將現有工作進行了梳理,系統地介紹了學習式數據庫各組件的研究動機、基本思路與關鍵技術,并對學習式數據庫系統未來的研究方向進行了展望.
《軒轅:AI 原生數據庫系統》提出了原生的支持人工智能的數據庫系統,將各種人工智能技術集成到數據庫中,以提供自監控、自配置、自優化、自診斷、自愈、自安全和自組裝功能,并通過聲明性語言讓數據庫提供人工智能功能,以降低人工智能使用門檻.
(5)人工智能賦能的數據應用
《基于PSP_HDP 主題模型的非結構化經濟指標挖掘》根據人工構建非結構化經濟指標的局限性,以及主題模型在非結構化經濟指標挖掘中存在的問題,結合已有經濟領域分類標準、詞語之間的語義關系和詞語對主題的代表性,定義了文檔的領域隸屬度、詞語與主題的語義相關度和詞語對主題的貢獻度,提出相應的主題模型,提高了經濟主題的區分度和辨識度,可以更有效地挖掘與經濟有關的經濟主題和經濟要素詞.
《機器學習中的隱私攻擊與防御》分析了機器學習模型的訓練集在數據采集、模型訓練等各個環節中存在的隱私泄露風險為人工智能環境下的數據管理所提出的挑戰,指出傳統數據管理中的隱私保護方法無法滿足機器學習中多個環節、多種場景下的隱私保護要求,總結并展望了機器學習技術中隱私攻擊與防御的研究進展和趨勢.
《數據集成方法發展與展望》綜述數據集成領域從2001 年開始到現在的相關工作的發展脈絡,并展望了未來在數據集成領域的潛在研究方向.
本專刊主要面向數據庫、數據挖掘、大數據、機器學習、推薦系統等多領域的研究人員和工程人員,反映了我國學者在人工智能賦能的數據管理、分析與系統領域最新的研究進展.感謝《軟件學報》編委會和數據庫專委會對專刊工作的指導和幫助,感謝專刊全體評審專家及時、耐心、細致的評審工作,感謝踴躍投稿的所有作者.希望本專刊能夠對人工智能賦能的數據管理、分析與系統相關領域的研究工作有所促進.
審核編輯:符乾江
-
人工智能
+關注
關注
1791文章
46859瀏覽量
237567 -
大數據
+關注
關注
64文章
8863瀏覽量
137299 -
深度學習
+關注
關注
73文章
5492瀏覽量
120977
發布評論請先 登錄
相關推薦
評論