精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人工智能可以像人一樣描述圖像?

姚小熊27 ? 來源:人工智能實驗室 ? 作者:人工智能實驗室 ? 2020-10-16 10:58 ? 次閱讀

準確地描述圖像,而不僅僅是像一個毫無頭緒的機器人,長期以來一直是人工智能的目標。2016年,谷歌表示,其人工智能可以為圖像添加幾乎與人類一樣的字幕,準確率為94%。現在微軟說它已經更進一步:研究人員已經建立了一個比人類更精確的人工智能系統,以至于它現在位于nocaps圖像捕獲基準的排行榜首位。微軟聲稱,它比自2015年以來一直使用的圖像字幕模型好兩倍。

雖然這本身就是一個值得注意的里程碑,但微軟并不只是將這項技術獨家。它現在提供新的字幕模型作為Azure認知服務的一部分,這樣任何開發者都可以把它帶到他們的應用程序中。今天,它也可以在Seeing AI中使用,這是微軟為盲人和視障用戶開發的應用程序,可以幫助他們了解周圍的世界。今年晚些時候,字幕模式還將改進您在PowerPoint中用于Web、Windows和Mac的演示文稿,它還會在桌面平臺上的Word和Outlook中彈出。

Azure AI首席副總裁埃里克博伊德說:“[圖像字幕]是人工智能中最棘手的問題之一。它不僅代表著理解場景中的物體,還代表了它們是如何交互的,以及如何描述它們。”優化字幕技術可以幫助每一個用戶:它讓你更容易在搜索引擎中找到你正在尋找的圖像。對于視障用戶來說,它可以讓網絡和軟件導航變得非常好。

看到公司吹噓他們的人工智能研究創新并不少見,但這些發現迅速部署到運輸產品中的情況要罕見得多。Azure AI認知服務CTO黃學冬,考慮到對用戶的潛在好處,力推將其快速整合到Azure中。他的團隊用標有特定關鍵字的圖像訓練了這個模型,這幫助它提供了一種大多數人工智能框架所沒有的視覺語言。通常,這些類型的模型使用圖像和完整的字幕進行訓練,這使得模型更難了解特定對象是如何交互的。

黃學冬在一篇博客文章中說:“這種視覺詞匯的預訓練本質上是訓練系統所需的教育;我們正在努力教育這種運動記憶。”這就是為什么這個新模型在nocaps基準中占據了一席之地,該基準專注于確定人工智能對他們以前從未見過的圖像的字幕能力有多好。

但是,雖然打破基準意義重大,但對微軟新模式的真正考驗將是它在現實世界中的運作方式。根據Boyd的說法,看到人工智能開發人員Saqib Shaik,他自己也是一個盲人,也在微軟推動更好的可訪問性,他將其描述為比他們之前提供的產品有了戲劇性的改進。現在微軟已經建立了一個新的里程碑,看看谷歌和其他研究人員的競爭模型如何競爭將是一件有趣的事情。
責任編輯:YYX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6567

    瀏覽量

    103959
  • 人工智能
    +關注

    關注

    1791

    文章

    46872

    瀏覽量

    237606
收藏 人收藏

    評論

    相關推薦

    嵌入式和人工智能究竟是什么關系?

    領域,如工業控制、智能家居、醫療設備等。 人工智能是計算機科學的個分支,它研究如何使計算機具備人類一樣思考、學習、推理和決策的能力。
    發表于 11-14 16:39

    Vicor技術如何改進生成式人工智能的供電

    生成式人工智能(genAI)帶來的文化革命可能互聯網普及一樣對人類產生深遠影響。從您的角度來看,目前情況如何?
    的頭像 發表于 10-16 09:54 ?276次閱讀
    Vicor技術如何改進生成式<b class='flag-5'>人工智能</b>的供電

    《AI for Science:人工智能驅動科學創新》第6章AI與能源科學讀后感

    幸得好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅動科學創新》的第6章后,我深刻感受到人工智能在能源科學領域中的巨大潛力和廣泛應用。這
    發表于 10-14 09:27

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    很幸運社區給我個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們揭示了人工智能技術在生命科學領域中的廣泛應用和深遠影響。在
    發表于 10-14 09:21

    《AI for Science:人工智能驅動科學創新》第人工智能驅動的科學創新學習心得

    周末收到本新書,非常高興,也非常感謝平臺提供閱讀機會。 這是本挺好的書,包裝精美,內容詳實,干活滿滿。 《AI for Science:人工智能驅動科學創新》這本書的第章,作為整
    發表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    RISC-V在人工智能圖像處理領域的應用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應用前景的詳細分析:
    發表于 09-28 11:00

    請問studio中可以裸機一樣調用定時器中斷嗎?

    studio中可以裸機一樣調用定時器中斷嗎?我調用后顯示出錯了,使用hal庫還需要添加什么嗎
    發表于 09-13 08:18

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新

    ! 《AI for Science:人工智能驅動科學創新》 這本書便將為讀者徐徐展開AI for Science的美麗圖景,與大家起去了解: 人工智能究竟幫科學家做了什么? 人工智能
    發表于 09-09 13:54

    FPGA在人工智能中的應用有哪些?

    FPGA(現場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現在以下幾個方面: 、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發表于 07-29 17:05

    人工智能如何改變著各行各樣

    人工智能的風起云涌,幾乎顛覆了千行百業創新的節奏,今天的人工智能就如同揮舞著“指揮棒”一樣,改變著各行各樣本來的“模樣”。
    的頭像 發表于 07-19 10:58 ?461次閱讀
    <b class='flag-5'>人工智能</b>如何改變著各行各樣

    圖像識別屬于人工智能

    屬于。圖像識別是人工智能(Artificial Intelligence, AI)領域的個重要分支。 圖像識別概述 1.1 定義
    的頭像 發表于 07-16 10:44 ?962次閱讀

    Meta高管稱大語言模型永遠無法人類一樣

    Meta的人工智能主管楊立昆近日表示,盡管ChatGPT等生成式人工智能產品備受矚目,但其背后的大型語言模型(LLM)永遠無法實現像人類一樣的推理和計劃能力。
    的頭像 發表于 05-27 09:50 ?419次閱讀

    5G智能物聯網課程之Aidlux下人工智能開發(SC171開發套件V2)

    ://t.elecfans.com/v/27221.html *附件:初學者完整學習流程實現手寫數字識別案例_V2-20240506.pdf 人工智能 語音對話機器案例 26分03秒 https
    發表于 05-10 16:46

    5G智能物聯網課程之Aidlux下人工智能開發(SC171開發套件V1)

    *附件:初學者完整學習流程實現手寫數字識別案例.pdf 人工智能 語音對話機器案例 26分03秒 https://t.elecfans.com/v/27185.html *附件:語音對話機器
    發表于 04-01 10:40

    嵌入式人工智能的就業方向有哪些?

    嵌入式人工智能的就業方向有哪些? 在新輪科技革命與產業變革的時代背景下,嵌入式人工智能成為國家新型基礎建設與傳統產業升級的核心驅動力。同時在此背景驅動下,眾多名企也紛紛在嵌入式人工智能
    發表于 02-26 10:17