通義千問近日開源了其首個千億級參數模型Qwen1.5-110B,這是其全系列中首個達到千億級別的開源模型。Qwen1.5-110B模型繼承了Qwen1.5系列的Transformer解碼器架構,并在技術上引入了分組查詢注意力方法(GQA),極大地提升了模型在推理時的效率。
這款擁有1100億參數的模型支持高達32K的上下文長度,同時展現出了卓越的多語言能力。無論是中文、英文、法語、德語、西班牙語、俄語,還是日語、韓語、越南語和阿拉伯語等,Qwen1.5-110B都能提供精準、流暢的語言處理體驗。這一里程碑式的開源模型,無疑將為AI領域的科研人員、開發者和愛好者提供更為強大、靈活的工具。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
開源
+關注
關注
3文章
3256瀏覽量
42420 -
通義千問
+關注
關注
1文章
24瀏覽量
234
發布評論請先 登錄
相關推薦
阿里通義千問發布Qwen2.5-Turbo開源AI模型
近日,阿里通義千問官方宣布,經過數月的精心優化與改進,正式推出了Qwen2.5-Turbo開源AI模型。這款新
通義千問三款主力模型再降價
阿里云百煉平臺再次掀起降價風暴,三款通義千問主力模型——Qwen-Turbo、Qwen-Plus及Qwen-Max,繼5月首次大幅度降價后,再次迎來價格調整。此次降價力度空前,Qwen
【附實操視頻】聆思CSK6大模型開發板接入國內主流大模型(星火大模型、文心一言、豆包、kimi、智譜glm、通義千問)
接入文心一言、通義千問、豆包、智譜glm、kimi等國內的大模型,但由于各家接口和數據格式不一樣,調試驗證會浪費很多時間。因此本篇以聆思CSK6大模
發表于 08-22 10:12
智能硬件接入主流大模型做語音交互(附文心一言、豆包、kimi、智譜glm、通義千問示例)
接入文心一言、通義千問、豆包、智譜glm、kimi等國內的大模型,這個是必須可以的。但由于各家接口和數據格式不一樣,有些朋友直接參考chatgpt的方式沒有走通,因此本篇以聆思CSK6
發表于 08-21 19:13
阿里通義千問Qwen2大模型發布并同步開源
阿里巴巴集團旗下的通義千問團隊宣布,全新的Qwen2大模型正式發布,并在全球知名的開源平臺Hugging Face和ModelScope上同
阿里通義千問Qwen2大模型發布
阿里巴巴最近發布了其通義千問系列的新成員——Qwen2大模型,并在Hugging Face和ModelScope兩大平臺上實現了同步開源。這
ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您?
]?就以“ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您”這樣的主題,開展了一次深度的大語言模型的測評。開放夜現場測評
阿里云正式發布通義千問2.5,中文性能全面趕超GPT-4 Turbo
在通義大模型發布一周年之際,阿里云邁出了歷史性的一步。近日,阿里云正式發布通義千問2.5版本,其性能全面超越GPT-4 Turbo,榮登中文
阿里云發布通義千問2.5
阿里云近日正式發布了通義千問2.5,標志著其人工智能技術在中文語境下取得了重要突破。據阿里云智能集團首席技術官周靖人介紹,通義千
阿里云通義千問發布320億參數模型,優化性能及效率
與之前的模型相比,新版320億參數模型在性能、效率以及內存占用方面取得了明顯改善。具體來說,32B在智能體場景下能力優于14B模型,并且推理成本較小。
聯發科天璣9300等旗艦芯片搭載通義千問大模型,成功實現
通義千問大模型可在離線環境下輕松應對多輪AI對話。此外,阿里云也承諾與聯發科進行深度合作,為全球手機制造商提供端側大模型解決方案。
聯發科天璣9300搭載通義千問大模型,阿里云提供解決方案
通義千問大模型已開源多項版本,包括18億、70億、140億及720億參數等版本伴隨視覺、音頻多模
評論