精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

北美有的,中國也有了!Zilliz Cloud向量數據庫云服務重磅登場

OSC開源社區 ? 來源:OSC開源社區 ? 2023-07-12 16:30 ? 次閱讀

2023年注定是屬于大模型和向量數據庫的巔峰時刻。國內大模型的發展也迎來前所未有之機遇,“百模”激戰正酣。在剛閉幕的世界人工智能大會上,國內外科技公司全線加入,三十余款大模型集中亮相,“國家隊”塵埃落定,并正式啟動大模型測試國家標準制訂,掀起新一輪大模型熱浪。而作為“大模型記憶體”、AIGC應用開發新范式的重要組成部分,向量數據庫的演進也逐漸達到了前所未有的新高度。

Milvus自2019年正式開源以來,已經成長為全球最大、最活躍的向量數據庫開源項目與開發者社區。作為Milvus背后的開發者與運營者,Zilliz一直走在向量數據庫的最前沿,始終秉承為開發者提供易用性強、性價比高的向量數據庫服務的理念。經過五年的持續打磨,終于在國內推出了基于Milvus的全托管向量數據庫云服務產品——Zilliz Cloud。

cf88dcf2-1fdc-11ee-962d-dac502259ad0.png

經過不斷地開發與升級,Zilliz Cloud儼然成為向量數據庫賽道的領先者。隨著Zilliz Cloud在國內全面開啟向量數據庫云服務,也為向量數據庫的高速發展開啟了全新的紀元。對于此次在國內的服務落地,Zilliz秉承的使命和目標尤為清晰和明確:

?提供全球最專業的全托管向量數據庫云服務。

?打破向量數據庫服務集中在北美,國內無可用向量數據庫服務的尷尬局面。

?滿足向量數據庫服務多云的需求,避免業務被單一云環境限制。

?為跨境業務中所需要的統一向量數據庫服務和架構提供可行性。

?Milvus開源解決方案、SaaS、PaaS統一接口標準,無縫線下/云上遷移,并大幅度降低混合部署的綜合成本。

?提供比開源Milvus具有更高性價比、更穩定服務支持的產品和解決方案。

成熟穩定,全球率先支持十億級別向量規模的服務

Milvus自開源以來,一直都是企業用戶自建向量數據平臺的首選,全套技術解決方案已被上萬家企業所采用,其中百度、新浪、理想汽車、華泰證券、沃爾瑪、LINE、BIGO等頭部企業在實踐中經過反復驗證,均已順利投產。

cf9f9bea-1fdc-11ee-962d-dac502259ad0.png

向量數據庫是AIGC大模型的重要補充,是提供準確可靠、高度可擴展的長短期“記憶”的關鍵載體。近一年,向量數據庫項目如雨后春筍般涌現。然而,大部分向量數據庫支持的向量數據規模僅停留在千萬量級,并不具備支撐生產環境的能力。

相較之下,Milvus在過去5年的客戶應用場景覆蓋各行各業,早在2021年就實現穩定支持十億級向量規模的線上服務。如今,Zilliz Cloud的向量數據庫服務可輕松支持十億級以上規模向量數據,可用性高達99.9%。

此外,在產品與技術背后,Zilliz亦擁有全球最資深的向量數據庫專家團隊,可以為每一位企業用戶配備4名技術支持,“沒有人比我們更懂向量數據庫”是團隊對開源社區與商業化用戶的承諾。

高性能+高性價比,性能優異遠超同類產品

當前主流的向量數據索引算法是內存算法或內存/SSD混合,算法內核以矩陣計算為主(類似HPC),大規模向量檢索與分析是計算/內存雙重密集的任務。這意味著向量數據庫作為基礎設施,對于性能與成本更加敏感。

從性能方面來看,Zilliz Cloud在QPS和降低查詢延遲方面遠超其他同類產品。我們將ZillizCloud 、Milvus、Pinecone、ElasticCloud 4個常見的向量數據庫(ElasticCloud 嚴格來說不屬于向量數據庫,但附帶向量能力,在傳統文本檢索領域受眾最廣,可以視為目前傳統數據庫支持向量檢索的代表)在同等資源及6組向量查詢任務的同等條件下進行了對比(測試框架已開源,詳見VectorDBBench,Leaderboard)。

對比結果如下:

在查詢吞吐方面,ZillizCloud在全部6組查詢任務中全面力壓向量數據庫Pinecone,整體性能平均超越2倍以上。與此同時,Zilliz Cloud相比Milvus,也有將近一倍的提升,表現令人眼前一亮。ElasticCloud作為傳統文本檢索服務的代表,向量查詢能力主要為補充能力,這6組查詢任務的QPS均在50以下。

cfb16168-1fdc-11ee-962d-dac502259ad0.png

查詢延遲方面,Zilliz Cloud整體在10ms以下,Milvus整體在20ms以下,Pinecone在20-40ms之間,ElasticCloud差距較為明顯。

cfc213dc-1fdc-11ee-962d-dac502259ad0.png

性價比方面,主要考察Queries per dollar (高并發情況下,單位成本所能支持的查詢請求數量)。相較Pinecone、Elastic,Zilliz Cloud的優勢十分明顯。指標相比第二位的Pinecone最多可以高出1個數量級(Q1,Q2),在剩下的四組任務中普遍可以高3倍左右。(由于Milvus為開源方案,難以和商業化服務在相同標準下比較,我們在這組測試中將其移除。)

cfd44386-1fdc-11ee-962d-dac502259ad0.png

黑科技加持,軟硬件性能飆升,全新內核火力全開

Zilliz Cloud采用商業化引擎,綜合性能超過Milvus開源引擎的1倍以上。引擎針對典型場景進行深度優化,性能可提升 3-5 倍。

硬件層面,Zilliz與英偉達英特爾等一線硬件廠商有著長期穩定的合作,向量算法內核針對X86、ARMGPU進行了定制化優化。

軟件層面,Zilliz Cloud推出了Autoindex智能索引。智能索引根據用戶的向量維度、數據規模、數據分布、查詢特性進行持續的自動化調優,免去用戶索引類型選型以及參數調優的痛苦。據Zilliz內部測試,autoindex智能索引已經達到向量數據庫專家手工調優效果的84%,大幅超越用戶的平均水平。在下一階段,autoindex智能索引的功能還會得到大幅度增強,支持用戶指定recall進行優化,保證索引運行在指定查詢準確度的最優點。

當然,針對最近大火的AIGC應用,Zilliz Cloud也推出了專門的特性支持:

?動態schema,可以根據AIGC迭代需要,靈活擴展向量特征或標簽字段。

?PartitionKey,支持AIGC應用多用戶知識庫的利器,相較單獨建表方案,綜合成本可下降2-3個數量級。

?支持JSON類型,可以將JSON與embedding這兩種超強能力相結合,實現基于JSON與embedding向量的混合數據表示以及復雜的業務邏輯。

打破“CAP”不可能三角,給用戶靈活選擇

向量數據庫技術發展到現在并不完美,通常情況下,業務需要在成本(Cost)、查詢效果與準確度(Accuracy)、查詢性能(Performance)之間做權衡,即向量數據庫的CAP問題。目前來看,CAP是一個不可能三角,Zilliz的解法是在典型的位置給出局部最優解,并給用戶以靈活的選擇。

事實上,用戶的普遍場景可以歸納為性能需求型、容量需求型與成本敏感型。為此,Zilliz Cloud在向量數據庫實例中也相應提供了三類支持:性能型、容量型和經濟型。不同的實例類型由不同的算法與硬件資源組合而成,適用于不同的業務場景。

cfe4dd68-1fdc-11ee-962d-dac502259ad0.png

?性能型實例適用于需要低延遲和高吞吐量的向量相似性檢索場景,該類型的實例能夠保證毫秒級的響應。

性能型實例的適用場景包括但不限于:生成式AI、推薦系統、搜索引擎、聊天機器人、內容審核、LLM增強的知識庫、金融風控。

?容量型實例可以支持的數據量是性能型的5倍,但查詢延遲略有增加,因此適用于需要大量存儲空間的場景,尤其是需要處理千萬級以上向量數據的場景。

容量型實例的適用場景包括但不限于:搜索大規模的非結構化數據(如:文本、圖像、音頻視頻、藥物化學結構等)、侵權檢測、生物身份驗證。

?經濟型實例可支持的數據規模與容量型一致,但價格優惠7折左右,性能略有下降,適用于追求高性價比或預算敏感的場景。

經濟型實例的適用場景包括但不限于:數據標記或數據聚類、數據去重、數據異常檢測、平衡訓練集類型分布。

支持大模型與非結構化數據處理全生態覆蓋

沒有任何一套系統可以滿足使用者業務上的所有需求,向量數據庫也是如此。在以向量數據庫為支撐的業務中,往往需要處理多道流程,包括:

?業務數據的語義結構化,如從文本數據中梳理標題embedding、內容段落的embedding、一二級主題、閱讀時間;

?面向端到端效果的模型選型,如尋找能帶來最佳效果的embedding模型選型;

?模型與向量數據庫的集成,如向量數據庫查詢驅動的原始數據召回以及后續LLM對召回內容的總結或重構等。

為了進一步降低應用構建成本,提供標準化組件,Zilliz Cloud為開發者提供了雙重支持:

?大模型生態對接。2023年3月,Zilliz作為OpenAI首批向量數據庫合作伙伴,完成了Milvus與Zilliz Cloud的插件化集成,被納入官方推薦的向量數據庫插件名單。不止如此,Zilliz還與LangChain、Cohere、LlamaIndex、Auto-GPT、BabyAGI等熱門項目進行了深度集成。此外,與國產大模型如文心一言、通義千問、智譜AI、MiniMax、360智腦等對接工作正在進行中,近期將會有更多成果發布。

?面向非結構化數據處理流水線。Zilliz Cloud提供了開源的Towhee工具框架。開發者可以在熟悉的Python環境,以類似Spark的算子語法編寫自己的流水線,輕松處理文本、圖片、音頻、視頻、化合物結構等非結構化數據的ETL過程。Towhee同時提供自動化編排工具,一鍵在Python環境驗證過的流水線組織成基于Triton、TensorRT、ONNX以及一系列硬件加速算法的服務鏡像,面向如文本近似搜索、智能問答、知識庫等典型場景。當然,Towhee也提供深度優化的標準流水線。

目前,Zilliz Cloud提供SaaS和PaaS服務,其中SaaS已覆蓋AWS、GCP、阿里云,PaaS覆蓋AWS、GCP、Azure、阿里云、百度智能云、騰訊云和金山云。國內官網已同步上線,更多詳情和案例可以訪問Https://zilliz.com.cn(海外官網和云服務入口:Https://zilliz.com)。

為了加速打磨業界最佳實踐,我們即將啟動「尋找AIGC時代的CVP實踐之星」專題活動,Zilliz將聯合國內頭部大模型廠商一同甄選應用場景,由雙方提供向量數據庫與大模型頂級技術專家為用戶賦能,一同打磨應用,提升落地效果,賦能業務本身。如果你的應用也適合CVP框架,且正為應用落地和實際效果發愁,可直接申請參與活動,獲得最專業的幫助和指導。(注:CVP即C代表以ChatGPT為代表的LLMs,V代表Vector DB,P代表Prompt Engineering,聯系方式參見business@zilliz.com)

2023年伴隨著AGI和LLMs的爆發已經過半,加速探索大模型落地之路已經迫在眉睫。行業的高度共識推動著AI奇點的來臨,大模型將重構企業級應用,重塑人工智能產業的發展方向。Zilliz表示,未來將持續聚焦向量數據庫行業發展的最前沿,以各行各業的智能化演進為目標,為大模型時代的企業和開發者提供最具競爭力的“大模型記憶體”。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據庫
    +關注

    關注

    7

    文章

    3712

    瀏覽量

    64025
  • 開源
    +關注

    關注

    3

    文章

    3126

    瀏覽量

    42070
  • 阿里云
    +關注

    關注

    3

    文章

    922

    瀏覽量

    42780

原文標題:北美有的,中國也有了!Zilliz Cloud向量數據庫云服務重磅登場

文章出處:【微信號:OSC開源社區,微信公眾號:OSC開源社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一文詳解企業上數據庫是干嘛的

    業上數據庫是企業將其數據庫系統從傳統的本地數據中心遷移到由第三方服務提供商管理的遠程
    的頭像 發表于 09-13 11:49 ?135次閱讀

    軟通動力數據庫全棧服務,助力企業數據庫體系全面升級

    。在企業節與"數博會"展區,軟通動力受邀分享數據庫專業服務全棧解決方案,并重點展示以全棧服務為核心的數智化能力。 軟通動力高級數據庫
    的頭像 發表于 09-05 15:30 ?197次閱讀
    軟通動力<b class='flag-5'>數據庫</b>全棧<b class='flag-5'>服務</b>,助力企業<b class='flag-5'>數據庫</b>體系全面升級

    DTCC2024前瞻:天翼數據庫專家共話TeleDB發展藍圖

    數據庫是IT基礎設施領域重要的組成部分,天翼緊跟數據庫行業技術方向與創新趨勢,強化核心技術的自研實力,助力企業釋放數據價值。在8月22日-24日的第15屆
    的頭像 發表于 08-19 14:53 ?205次閱讀
    DTCC2024前瞻:天翼<b class='flag-5'>云</b><b class='flag-5'>數據庫</b>專家共話TeleDB發展藍圖

    大模型卷價格,向量數據庫“卷”什么?

    被大模型“帶飛”這一年,向量數據庫才剛剛寫下序言
    的頭像 發表于 05-23 09:24 ?1674次閱讀
    大模型卷價格,<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>“卷”什么?

    數據庫數據恢復—raid5陣列上層Sql Server數據庫數據恢復案例

    數據庫數據恢復環境: 5塊硬盤組建一組RAID5陣列,劃分LUN供windows系統服務器使用。windows系統服務器內運行了Sql Server
    的頭像 發表于 05-08 11:43 ?392次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—raid5陣列上層Sql Server<b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復案例

    搭載英偉達GPU,全球領先的向量數據庫公司Zilliz發布Milvus2.4向量數據庫

    在美國硅谷圣何塞召開的 NVIDIA GTC 大會上,全球領先的向量數據庫公司 Zilliz 發布 Milvus 2.4 版本。這是一款革命性的
    的頭像 發表于 04-01 14:33 ?356次閱讀
    搭載英偉達GPU,全球領先的<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>公司<b class='flag-5'>Zilliz</b>發布Milvus2.4<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>

    Zilliz攜手大模型生態企業玩轉GDC 2024,向量數據庫和RAG成行業焦點

    3 月 23 日-24 日,聚焦全球開發者精英,由上海市人工智能行業協會(SAIA)主辦的 2024 全球開發者先鋒大會(2024 GDC)在上海舉辦。Zilliz 作為向量數據庫賽道的領軍者,受邀
    的頭像 發表于 03-26 11:14 ?291次閱讀
    <b class='flag-5'>Zilliz</b>攜手大模型生態企業玩轉GDC 2024,<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>和RAG成行業焦點

    與NVIDIA深度參與GTC,向量數據庫大廠Zilliz與全球頂尖開發者共迎AI變革時刻

    近日,備受關注的 NVIDIA GTC 已拉開序幕。來自世界各地的頂尖 AI 開發者齊聚美國加州圣何塞會議中心,共同探索行業未來,全球領先的向量數據庫公司 Zilliz 也不例外。作為去年被
    的頭像 發表于 03-26 11:01 ?295次閱讀

    騰訊向量數據庫“卷”到哪一步

    被大模型“帶飛”這一年,向量數據庫才剛剛寫下序言
    的頭像 發表于 01-15 09:49 ?1497次閱讀
    騰訊<b class='flag-5'>云</b>把<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>“卷”到哪一步<b class='flag-5'>了</b>?

    數據庫數據恢復—SQLserver數據庫被加密如何恢復數據

    一臺服務器上的SQLserver數據庫被勒索病毒加密,無法正常使用。該服務器上部署有多個SQLserver數據庫,其中有2個數據庫及備份文件
    的頭像 發表于 11-23 14:42 ?794次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—SQLserver<b class='flag-5'>數據庫</b>被加密如何恢復<b class='flag-5'>數據</b>?

    吸引數萬名開發者參會!2023云棲大會現場,向量數據庫公司Zilliz成關注焦點

    大會的主題為“計算,為了無法計算的價值”,共吸引全球 44 個國家和地區的 8 萬多人參加,可謂 AI 時代最受關注的盛會之一。 作為全球最受歡迎的開源向量數據庫 Milvus 背后的商業公司,
    的頭像 發表于 11-13 14:57 ?622次閱讀
    吸引數萬名開發者參會!2023云棲大會現場,<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>公司<b class='flag-5'>Zilliz</b>成關注焦點

    達夢啟數據庫服務系統成功中標雄安新區綜合數據平臺項目

    近日,達夢啟數據庫服務系統成功中標雄安新區綜合數據平臺 (二期) 數據庫授權采購項目,將打造
    的頭像 發表于 11-08 09:16 ?579次閱讀

    達夢數據庫在三大運營商市場全面上線

    武漢2023年10月30日 /美通社/ -- 達夢數據庫中國移動、中國聯通、中國電信 市場上線。移動
    的頭像 發表于 10-31 09:14 ?859次閱讀

    數據庫數據恢復-oracle數據庫報錯無法打開的數據恢復案例

    oracle數據庫數據恢復環境: 一臺服務器,底層由12塊硬盤組成一組磁盤陣列,上層操作系統上運行oracle數據庫。 oracle數據庫
    的頭像 發表于 10-12 14:00 ?703次閱讀

    探尋向量數據庫爆火的真相,Zilliz 技術合伙人帶你解惑

    大模型時代的到來將向量數據庫的熱度推向高點,在此氛圍下,有人發出了哲學家般的一問:究竟是大模型選擇向量
    的頭像 發表于 09-28 11:40 ?457次閱讀
    探尋<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>爆火的真相,<b class='flag-5'>Zilliz</b> 技術合伙人帶你解惑