精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為了不讓AI帶有歧視色彩,谷歌操碎了心訓練模型

如意 ? 來源:極客公園 ? 作者:沈知涵 ? 2020-11-03 10:47 ? 次閱讀

土耳其語的「他」和「她」沒有性別的區分,統一用 O 表示。過去 Google Translate 在翻譯 o bir doktor(ta 是一位醫生)和 o bir hem?ire(ta 是一位護士)時,會把前者翻譯成 He is a doctor,把后者翻譯成 She is a nurse,只因為機器在學習數億數據和某些「社會規律」之后,「偏向」把醫生男性化,護士女性化。

看到這個問題后,Google 意識到要想辦法更好地訓練模型,讓它變得更加「中立」。后來 Google Translate 以增加選項的方式規避了這個問題。

「當然,該解決方案僅適用于幾種語言,僅適用幾個有代表性的單詞,但是我們正在積極嘗試擴展它。」Tulsee Doshi 在 Google I/O’19 上說道。

這只是 Google 這家公司將先進技術與技術價值觀合二為一的體現之一。上周 Meg Mitchel,Tulsee Doshi,Tracy Frey 三位谷歌科學家、研究學者向包括極客公園(id: geekpark)在內的全球媒體闡釋了 Google 如何理解機器學習公平性,以及為了打造一個「負責任的 AI」,Google 做了哪些事情。

要讓 AI 被人信任這件事情變得越來越重要。

「最近一次調研中,全球 90% 的受訪高管都遇到過人工智能的倫理問題,因此有 40% 的人工智能項目被放棄。從企業的角度來看,對 AI 的不信任正在成為部署 AI 最大的障礙,只有在 AI 被負責任地開發出來并且取得終端用戶信任的語境下,效率提升和競爭優勢才會得到充分體現。」Tracy Frey 說,打造一個負責任的 AI 成為 Google 上下最重要的事情之一。

兩年之前 Google 公布了 AI principles(人工智能原則),這些直指 AI 技術應用倫理的原則包括:

· 對社會有益(Be socially beneficial)

· 避免建立和加劇不公的偏見(Avoid creating or reinforcing unfair bias)

· 保障建立和測試安全性(Be built and tested for safety)

· 對人類負責(Be accountable to people)

· 建立并體現隱私保護原則(Incorporate privacy design principles)

· 支持并鼓勵高標準的技術品格(Uphold high standards of scientific excellence)

· 提供并保障上述原則的可操作性(Be made available for uses that accord with these principles)

只是把這些原則停留在字面上沒有意義,Google 為此形成了一個從理論到實踐的「閉環」。Tulsee Doshi 和她的團隊通過一些基礎性質的研究建立和迭代 AI 原則、規范,作為閉環的中心,他們一邊通過向高級顧問尋求改進建議,一邊讓產品團隊(Chrome、Gmail、Cloud 等)來實施和反饋。

Tulsee 舉了一個例子,Google 內部孵化器 Jigsaw 曾經開發了一個名叫 Perspective 的 API,它的工作就是在網絡對話、評論中尋找各種各樣的言論,自動評價它們是否帶有仇恨、辱罵、不尊重等行為,從 0-1 代表「毒性」從低到高。

比如「我想抱抱這只可愛的小狗」和「這只小狗也太討厭了吧」分別評分為 0.07 和 0.84。

當然機器也不是從一開始就「完美無瑕」。在 2017 年的 1.0 版本中,它給「我是直男」打分 0.07 分,給「我是同性戀」打分 0.84 分,與之相似的很多測試中,系統都被證實帶著身份認知上的偏見。

為了提升機器學習的公平性,Google 內部研發了一項名為對抗訓練(Adversarial Training)的技術——如何使機器學習模型對抗樣本更魯棒。2018 年開始,對抗訓練開始應用在 Google 產品中。緊接著今年 11 月,Google 會將此應用在 TensorFlow 更加廣泛的生態里。

「事實上,任何一位 Googler 都可以對一款產品、一份研究報告、一項合作進行 AI 原則審查。」Tulsee 說道。

比如去年,一位 Google 員工將照片跑在 Cloud Vision API 上時發現自己的性別被搞錯了,而這違反了 AI 原則的第二條「避免建立和加劇不公的偏見」。

發生這樣的失誤很好理解,單單從外表一個維度,機器很難正確地判斷出一個人的性別,所以后來 Google 干脆取消 Cloud Vision API 將圖像中的人標記為「男人」或「女人」的標簽功能。

Tracy Frey 稱這是因為今天機器學習面臨社會語境下的挑戰比以前更多了。在 AI 深入社會的過程中,必然有人類的刻板印象和偏見被帶入 AI,所以需要對模型進行迭代,保證其透明性和可解釋性,找準模型性能和公平之間的平衡點。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6142

    瀏覽量

    105106
  • AI
    AI
    +關注

    關注

    87

    文章

    30154

    瀏覽量

    268423
  • 機器學習
    +關注

    關注

    66

    文章

    8378

    瀏覽量

    132412
收藏 人收藏

    評論

    相關推薦

    為什么ai模型訓練要用gpu

    GPU憑借其強大的并行處理能力和高效的內存系統,已成為AI模型訓練不可或缺的重要工具。
    的頭像 發表于 10-24 09:39 ?194次閱讀

    AI模型訓練數據來源分析

    AI模型訓練數據來源廣泛且多元化,這些數據源對于構建和優化AI模型至關重要。以下是對AI
    的頭像 發表于 10-23 15:32 ?373次閱讀

    如何訓練自己的AI模型

    訓練自己的AI模型是一個復雜且耗時的過程,涉及多個關鍵步驟。以下是一個詳細的訓練流程: 一、明確需求和目標 首先,需要明確自己的需求和目標。不同的任務和應用領域需要不同類型的
    的頭像 發表于 10-23 15:07 ?596次閱讀

    如何訓練ai模型

    訓練AI模型是一個復雜且耗時的過程,涉及多個關鍵步驟和細致的考量。 一、數據準備 1. 數據收集 確定數據類型 :根據模型的應用場景,確定需要收集的數據類型,如文本、圖像、音頻等。
    的頭像 發表于 10-17 18:17 ?661次閱讀

    ai模型訓練需要什么配置

    AI模型訓練是一個復雜且資源密集的過程,它依賴于高性能的硬件配置來確保訓練的效率和效果。 一、處理器(CPU) CPU是計算機的核心部件,負責處理各種計算任務。在
    的頭像 發表于 10-17 18:10 ?868次閱讀

    蘋果AI模型訓練新動向:攜手谷歌,未選英偉達

    近日,蘋果公司發布的最新研究報告揭示了其在人工智能領域的又一重要戰略選擇——采用谷歌設計的芯片來訓練AI模型,而非行業巨頭英偉達的產品。這一決定在業界引起了廣泛關注,尤其是在當前英偉
    的頭像 發表于 08-01 18:11 ?902次閱讀

    蘋果承認使用谷歌芯片來訓練AI

    蘋果公司最近在一篇技術論文中披露,其先進的人工智能系統Apple Intelligence背后的兩個關鍵AI模型,是在谷歌設計的云端芯片上完成預訓練的。這一消息標志著在尖端
    的頭像 發表于 07-30 17:03 ?685次閱讀

    蘋果揭示AI新動向:Apple Intelligence模型谷歌云端芯片上預訓練

    蘋果公司在最新的技術論文中披露了一項重要信息,其全新的人工智能系統Apple Intelligence所依賴的模型并非傳統上大型科技公司首選的NVIDIA GPU,而是選擇了在谷歌設計的云端芯片上進行預訓練。這一決定不僅打破了行
    的頭像 發表于 07-30 15:00 ?483次閱讀

    ai模型訓練方法有哪些?

    AI模型訓練方法是一個復雜且不斷發展的領域。以下是ai模型訓練方法: 數據預處理和增強 數據
    的頭像 發表于 07-16 10:11 ?1349次閱讀

    ai模型ai框架的關系是什么

    的數據和計算資源來進行訓練AI模型的主要特點包括: 1.1 參數數量大:AI模型的參數數量通常在數百萬到數十億之間,這使得它們能夠捕捉
    的頭像 發表于 07-16 10:07 ?4w次閱讀

    李彥宏:開源模型將逐漸滯后,文模型提升訓練與推理效率

    李彥宏解釋道,百度自研的基礎模型——文 4.0,能夠根據需求塑造出適應各類場景的微型版模型,并支持精細調整以及后預訓練。相較于直接使用開源模型
    的頭像 發表于 04-16 14:37 ?417次閱讀

    谷歌模型訓練軟件有哪些?谷歌模型訓練軟件哪個好?

    谷歌模型訓練方面提供了一些強大的軟件工具和平臺。以下是幾個常用的谷歌模型訓練軟件及其特點。
    的頭像 發表于 03-01 16:24 ?815次閱讀

    谷歌模型訓練軟件有哪些功能和作用

    谷歌模型訓練軟件主要是指ELECTRA,這是一種新的預訓練方法,源自谷歌AI。ELECTRA不僅
    的頭像 發表于 02-29 17:37 ?747次閱讀

    谷歌發布開源AI模型Gemma

    近日,谷歌發布了全新AI模型Gemma,這款模型為各種規模的組織提供了前所未有的機會,以負責任的方式在商業應用中進行分發。
    的頭像 發表于 02-28 17:38 ?812次閱讀

    新火種AI | 谷歌Gemini“抄襲”百度文一言?AI訓練數據陷難題

    谷歌自己放出“實錘”,Gemini化身百度文模型
    的頭像 發表于 12-20 09:09 ?481次閱讀
    新火種<b class='flag-5'>AI</b> | <b class='flag-5'>谷歌</b>Gemini“抄襲”百度文<b class='flag-5'>心</b>一言?<b class='flag-5'>AI</b><b class='flag-5'>訓練</b>數據陷難題