精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

鑒黃AI是怎樣煉成的?“AI最好的應用模式依然是人+機”

jmiy_worldofai ? 來源:未知 ? 作者:李倩 ? 2018-08-20 14:40 ? 次閱讀

又一薪水高、“福利”好的職業或要被人工智能(AI)替代了。

近日,阿里巴巴集團(下稱“阿里”)安全部在接受澎湃新聞(www.thepaper.cn)采訪時介紹了AI鑒黃的有關工作:當用戶輸入一張圖片,AI將返回一個0-100之間的分值。這個分值非線性地標示了圖片含色情內容的概率。對于互聯網場景模型,得分99及以上的圖片幾乎可以肯定是色情圖,無需人工復審;得分50-99的需要人工審核;得分50以下的認為是正常圖。

隨著AI鑒黃技術的發展,人工鑒黃師逐漸從鑒黃行業里被解放出來。阿里安全部高級算法專家威視向澎湃新聞介紹,假設一天要審核4億張圖片,單純由人工來審,如果一人一天審1萬張,就需要4萬人。而經由AI鑒黃后需要交由人工審核的量大約只需20萬張,這樣只需要20人,大大節省了人力。

不僅僅在識圖領域,威視告訴澎湃新聞,AI鑒黃還覆蓋到了語音、視頻等多媒體領域,目前已經可以識別中文、英文、日文、俄文等語言,還可以識別中國多省份方言,無語義的呻吟聲也能識別。據悉,阿里將在8月21日舉辦的網絡安全生態峰會上,集中展示這些技術。

鑒黃AI是怎樣煉成的?

阿里的鑒黃AI做的色情圖片檢測,從原理上來說,就是一個典型的圖像分類問題。當前的解決方案是標注樣本后,使用深度學習技術訓練一個人工神經網絡。具體步驟包括明確分類標準→收集樣本→樣本打標→模型訓練,四個步驟。其中前三個步驟主要由人工完成。

這四個步驟聽起來似乎是最后一步的技術難度最高,實際上阿里的相關人士向澎湃新聞透露,花時間最久的是第一步。

“雖然實打實的比如‘露點不露點’之類的色情,還有比較明確的判斷標準,”威視表示,“對于低俗和性感類,爭議就比較多,不同的人有不同的認識。”

現實世界是復雜的,威視舉了個例子,以兒童色情的問題為例:兒童露點算不算色情?有人會說:男孩不算,女孩算。又有人質疑:如果男孩年齡較大呢?如果是發育較早的孩子呢?于是又又有人說,十二三歲的男孩子露點算色情。那么,十一歲的呢?或者,如何從圖片中判斷孩子年齡到底有多大呢?

威視告訴澎湃新聞,雖然明確分類標準是設計步驟時的第一步,但在后續打標過程中,遇到實際的問題還要再對標準進行不斷的修正和增補。

被鑒黃AI誤認為是色情的圖片

在收集樣本的過程中,團隊“集思廣益”,瀏覽了近2000家網站,下載了超過6000萬張疑似色情圖片,實際去重后約2300萬張圖片,并實際標注了超過1300萬張圖片。這1300多萬張圖片成為模擬訓練的原始數據庫,因此這一浩大的工程,被技術人員認為是鑒黃引擎成功最重要的基石。

樣本打標過程依然主要由人工完成對2000萬張圖片的打標。威視介紹,他們做了一個打標工具,并建立了質量控制體系。打標前對所有參加標注的人員先進行培訓,學習打標標準,做練習題考試,考試通過之后才能上崗。標中通過事先已有答案的校驗題,或多人對同一對象打標的方式,進行標中控制。標后的控制,就是通過模型判斷,找出可疑部分再進行人工標注。

威視表示,之所以嚴格把握樣本打標的過程,是因為深度學習,對高質量的標注數據是有很高的要求。數據標志質量越高,最后模型的精度就會越高。

于是,由人類經過千挑萬選、做題考試后建立起來的高質量“色情圖片”數據庫,最后交由模型訓練。威視表示,GPU機器單機單卡的情況下訓練時間要近一個月。后來阿里團隊更換了網絡結構并實現了多機多卡訓練,將千萬級別樣本的訓練時間控制在一周左右。

“AI最好的應用模式依然是人+機”

那么,高效和低成本的AI鑒黃,是否會完全替代人工鑒黃師?

對此,阿里安全部產品專家念夏向澎湃新聞表示,目前AI鑒黃最好的應用模式仍然是人工+機器。不管是前期設計模型的標準和實際打標,還是后期人工復核,人的參與都是不可或缺的。

2015年7月的“北京三里屯優衣庫事件”,一段時長1分鐘的試衣間不雅視頻流出,并2個小時內在各大網絡平臺上迅速完成了過億的轉發量。但目前只有人的頭腦擁有足夠的“意識”判斷這些單獨的突發性事件,是否屬于“違規”。

“已知的、有清晰標準定義的風險,AI都已經能解決了。”念夏表示,真正的難點是惡意的突發事件,爆發了就是爆發了,這種情況下,由于之前對該事件或場景缺乏標準的定義,當時要直接給AI及時去處理,是不可能的。”

另一種類型就是非常模棱兩可的場景,即AI打分在50-99分之間的內容。念夏表示,帶有主觀個人意識或者群體意識的部分,就是需要人工審核的核心部分。

此外,包括特定的體育運動以及國際標準差異等問題,前期模型調整和后期復核標準變化,也需要人工審核的出馬。

威視表示,目前像包括相撲、摔跤、藝術體操甚至游泳等門類的運動,由于穿著較為特殊,一般把這類多媒體作品定性為性感類,經由人工復核,終極目標還是希望能讓AI直接分辨出圖片上的人是在參加運動比賽。

被鑒黃AI誤認為是色情的圖片

從國際上來看,雖有通用的鑒黃標準,但也會有與國內標準大相徑庭的地方。念夏向澎湃新聞舉了個例子:“國內如果直播給小寶寶洗澡,其實沒什么事,大家覺得很可愛。但在國外是絕對不行的,而且屬于嚴重違規。”

阿里的AI除了用于鑒黃,念夏表示利用這個原理,還能訓練AI做類似編審的工作,比如選取視頻封面、鑒定重復視頻等。“不僅是做合規方面的事情,我們希望利用AI去做真正的生產提效,用技術解決更多社會問題。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30146

    瀏覽量

    268414
  • 人工智能
    +關注

    關注

    1791

    文章

    46859

    瀏覽量

    237567

原文標題:阿里AI鑒黃師一日鑒圖數億張 人工鑒黃師要"涼涼"了

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    人工智能語音,高科技助力凈化網絡環境

    、英文、俄文等多國語言,還可以識別湖南、湖北、河南、東北、四川、廣東等地方言。 真是有多大膽,技術就有多先進,網絡居然也開始運用人工智能語音技術了,實在讓人意外。隨著阿里的AI
    的頭像 發表于 09-04 09:44 ?1.4w次閱讀

    壞蛋是怎樣煉成的txt全集下載

    的故事,讓書友們為之沸騰。  《壞蛋》已成為一種情結,一種壞蛋情節……《壞蛋是怎樣煉成的II》——王者歸來!主要講述一個壞蛋的成長  有人就有恩怨,有恩怨,就有江湖。就是江湖,叫我怎么退出。  男人
    發表于 01-05 17:35

    阿里云智能視頻 AI 重裝來襲

    快速、服務方式靈活等核心優勢:多模態分析,標簽體系完善。視覺、語音、文本、運動等多模態信息分析技術,并且綜合優酷、土豆、UC海外視頻標簽體系打造最全面的視頻標簽系統;千千面,高精準度。利用多項AI
    發表于 01-23 15:19

    年輕,以后讓AI給你升職加薪吧

    的人就等于浪費了彼此的時間,所以使用機器可以同時對多個應聘者進行面試,是最好的選擇。4AI招聘的使用門檻高嗎?AI招聘是一個市場空間很大的新技術,但按照當前的情況來看,
    發表于 08-28 09:16

    AI語音智能機器開發實戰

    第四期直播PPT下載:第三期直播PPT+程序下載:第二期直播PPT下載:第一期直播PPT下載:主題簡介及亮點:以AI智能語音陪護機器人為載體,徹底講解整個機器研發的全流程,從開發環境搭建、到軟硬件
    發表于 01-04 11:48

    關在釘釘和企業微信上使用AI視頻面試——AI得賢招聘官操作說明

    。其包含一鍵發布、簡歷庫集合查重、AI簡歷解析、遠程實時視頻面試、AI視頻面試、AI面試聊天機器AI面試電話機器
    發表于 03-07 19:30

    AI學習】AI概論:(Part-A)與AI智慧交流

    任務一:電腦+AI(讓電腦擁有學習能力)目標:安裝Python和TensorFlow。安裝Keras、Numpy、OpenCV。安裝ResNet50工智慧模組(模型)。 運行測試程序,展現簡單
    發表于 10-30 14:04

    AI概論:來來來,成為AI的良師益友》高煥堂老師帶你學AI

    能夠表現出與類相類似的智慧行為,包括學習、記憶及預測(推論)的思考能力,以及模擬類感官識別和動作行為等。6.【AI學習】第3篇--人工神經網絡簡介:本篇主要介紹:人工神經網絡的起源、簡單神經網絡
    發表于 11-05 17:55

    【HarmonyOS HiSpark AI Camera】基于HiSpark AI Camera HarmonyOS 智能巡檢機器開發

    本帖最后由 馬猛 于 2020-11-26 10:17 編輯 項目名稱:基于HiSpark AI Camera HarmonyOS 智能巡檢機器開發試用計劃:HiSpark AI
    發表于 11-18 18:15

    我的AI課堂 ---讓學生們都成為AI世界裡的主角

    `1、把AI擬人化:邀請您來成為AI世界裡的主角 在本文裡,我來分享我的AI課堂模式:把AI擬人化,並且讓同學成為
    發表于 12-11 10:15

    AI芯片最新格局分析 精選資料分享

    來源:中金公司,作者樂平、何玫與楊俊杰AI 芯片設計是人工智能產業鏈的重要一環。 自 2017 年 5 月以來,各 AI 芯片廠商的新品競相發布,經過一年多的發展,各環...
    發表于 07-23 07:14

    怎樣去解決在stm32上做ai的問題

    **(嵌入式AI)關于在stm32上做ai的一些問題,工具用的是STM32CubeIDE也可以用STM32CubeMX,用IDE更好1.pytorch中很多語句是不可以用cubeAI analyze
    發表于 12-14 07:47

    AI是什么呢?AI應用又會給人們帶來哪些改變

    Intelligence的縮寫,即人工智能。它是研究、開發用于模擬、延伸和擴展的智能的理論、方法、技術及應用系統的一門新的技術科學。AI的研究工作已取得驚人進展,經過學習后,機器在操作某些環節時比人類更快、更精
    發表于 12-20 06:42

    AI語音有多厲害?平臺用它來,企業用它來電銷

    設計初衷和工作模式來看,“AI機器”和電銷機器也幾乎如出一轍,由于原有的人工勞動重復度較
    的頭像 發表于 08-22 14:58 ?3704次閱讀

    開源AI新鮮出爐:代碼+預訓練模型,附手把手入門教學

    今天我們就來學習用Keras構建模型,識別NSFW圖片,俗稱造個AI
    的頭像 發表于 04-16 16:40 ?3924次閱讀