據外媒,知名機器學習公司OpenAI近日推出兩套多模態人工智能系統模型DALL-E和CLIP,DALL-E可以基于文本直接生成圖像,CLIP能夠完成圖像與文本類別的匹配。DALL-E可以將以自然語言形式表達的大量概念轉換為恰當的圖像,并使用了GPT-3 同樣的方法,只不過DALL-E將其應用于文本-圖像對。
另一個神經網絡CLIP能夠執行一系列視覺識別任務。給出一組以語言形式表述的類別,CLIP能夠立即將一張圖像與其中某個類別進行匹配,而且它不像標準神經網絡那樣需要針對這些類別的特定數據進行微調。在ImageNet基準上,CLIP的性能超過ResNet-50,在識別不常見圖像任務中的性能遠超ResNet。
雖然CLIP在識別常見對象時往往表現良好,但在計算圖像中對象數量等更抽象或更系統的任務,以及預測照片中最靠近車輛間的距離等更復雜任務上的表現不佳。在這兩項任務上,zero-shot CLIP的效果也只比隨機猜測好一點。
責任編輯:YYX
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
人工智能
+關注
關注
1791文章
46859瀏覽量
237579 -
OpenAI
+關注
關注
9文章
1043瀏覽量
6408
發布評論請先 登錄
相關推薦
Meta發布多模態LLAMA 3.2人工智能模型
Meta Platforms近日宣布了一項重要技術突破,成功推出了多模態LLAMA 3.2人工智能模型。這一創新
云知聲推出山海多模態大模型
在人工智能技術的浩瀚星海中,多模態交互技術正成為引領未來的新航標。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創新之姿,推出了其匠心
OpenAI發布高性價比小型AI模型GPT-4o mini
在人工智能領域持續創新的OpenAI,近日推出了其最新力作——“GPT-4o mini”,一款旨在以親民價格提供強大功能的小型聊天機器人。這款產品的問世,標志著OpenAI在推動
智譜AI發布全新多模態開源模型GLM-4-9B
近日,智譜AI在人工智能領域取得重大突破,成功推出全新開源模型GLM-4-9B。這款模型以其卓越的多模態
OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了
當地時間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強大基礎上,這種迭代擁有顯著的改進。在發布會的演示中,OpenAI展示
發表于 05-27 15:43
OpenAI推出更快更便宜的大語言模型GPT-4o
美國人工智能公司OpenAI于14日凌晨正式推出了一個更快、更便宜的人工智能模型來支持其聊天機器人ChatGPT。
OpenAI推出新款人工智能模型GPT-4o
人工智能領域的領軍者OpenAI在最近的春季更新活動中,重磅推出了全新升級的ChatGPT版本,它支持了GPT-4o這一強大的人工智能模型。
OpenAI有望在年中推出全新GPT-5模型
近日,人工智能領域的領軍企業OpenAI傳來了令人振奮的消息。據悉,他們有望在今年的年中,大約是夏季時分,推出全新的GPT-5模型。這一消息引發了業界的廣泛關注與期待。
蘋果發布300億參數MM1多模態大模型
近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的多模態大模型研究成果——MM1。這款具有高達300億參數的多模態
Anthropic 聲稱其新的 AI 聊天機器人模型擊敗了 OpenAI 的 GPT-4
的人工智能公司,該公司表示,新的Claude3系列人工智能模型的性能與Google和OpenAI的領先模型一樣好,甚至更好。與早期版本不同,
OpenAI迎戰紐約時報指控 非法使用其內容訓練人工智能模型
OpenAI迎戰紐約時報指控 《紐約時報》提起版權訴訟指控OpenAI非法使用其內容訓練人工智能模型,OpenAI積極迎戰,
OpenAI推出新款大模型Sora,引領多模態AI新潮流
全球人工智能領域的佼佼者OpenAI近日發布了一款名為Sora的短視頻生成模型,該模型能夠根據文字指令即時生成高質量短視頻,引起了業界的廣泛關注。
人工智能領域多模態的概念和應用場景
隨著人工智能技術的不斷發展,多模態成為了一個備受關注的研究方向。多模態技術旨在將不同類型的數據和信息進行融合,以實現更加準確、高效的
評論