YOLO 的全稱“You Only Look Once”，它通過引入一種與傳統方法截然不同的方法，徹底改變了物體檢測領域。YOLO 擺脫了傳統的提案驅動技術，創新地在一次傳遞中直接從完整圖像中預測邊界框和類別概率。這種突破常規的做法不僅簡化了物體檢測流程，還顯著加快了檢測速度，使實時檢測不僅成為可能，而且成為現實。

概念概述

YOLO 創新方法的核心是將對象檢測視為單一回歸問題的概念，從圖像像素直接到邊界框坐標和類別概率。以下是 YOLO 如何實現這一點的細分：

網格劃分：YOLO 首先將輸入圖像劃分為S×S網格。每個網格單元負責預測中心位于該單元內的物體。這種劃分使模型能夠定位物體并確保檢測分布在圖像上。
邊界框預測：對于每個網格單元，YOLO 會預測多個邊界框。每個邊界框預測包括坐標（中心、寬度和高度）以及置信度分數，該分數反映了邊界框的準確性以及該框包含特定對象的可能性。
類別概率：除了邊界框預測之外，每個網格單元還會預測其檢測到的對象屬于哪個類別的概率。這些概率取決于包含對象的網格單元。
組合預測：YOLO 流程的最后一步是將邊界框預測與類別概率相結合，以提供完整的檢測輸出。每個邊界框的置信度分數由類別概率調整，確保檢測既反映邊界框的準確性，又反映模型對對象類別的置信度。

這種簡化的方法可以同時分析圖像的每個部分，從而使 YOLO 能夠實現驚人的速度，同時又不影響準確性。YOLO 只需查看一次整個圖像（因此得名），就可以了解圖像的全局背景，從而減少誤報，并使其在實時應用中非常高效。YOLO 架構的簡單性和有效性不僅使其成為對象檢測任務的熱門選擇，而且還激發了該領域的進一步創新和研究，突破了計算機視覺的極限。

YOLO 架構揭曉

從圖像到預測

YOLO 架構是一個引人注目的例子，展示了如何利用卷積神經網絡 (CNN) 完成物體檢測等復雜任務。與可能輸出單個類別概率向量的傳統 CNN 不同，YOLO 架構旨在輸出包含邊界框預測和類別概率的多維張量。以下是它如何處理圖像的概述：

卷積主干：YOLO 使用一系列卷積層作為主干。這些層負責從輸入圖像中提取特征。這些層的架構在 YOLO 的不同版本（例如 YOLOv3、YOLOv4 等）之間可能有所不同，每個版本都旨在在速度和準確性之間取得平衡。
特征提取：當圖像穿過卷積層時，網絡會提取和下采樣特征，從而創建一個豐富的特征圖，其中包含檢測所需的基本信息。
預測層：在網絡末端，YOLO 過渡到預測層，該層通常是具有特定數量濾波器的卷積層。這些濾波器對應于每個網格單元的預測向量，包括邊界框坐標、置信度分數和類別概率。
輸出張量：輸出是形狀為 (S×S×(B×5+C)) 的張量，其中S×S是網格大小，B是每個網格單元的邊界框數量，55 表示四個邊界框坐標加上置信度分數，C表示類別數量。此張量封裝了網絡對圖像進行的所有檢測。

代碼片段：加載和使用預訓練的 YOLO 模型

以下是一個簡化的 Python 示例，演示如何使用流行的深度學習框架（例如 TensorFlow 或 PyTorch）加載預訓練的 YOLO 模型并對圖像執行對象檢測。此示例假設使用 PyTorch 并且可以使用預訓練的 YOLO 模型：

import torch
import torchvision.transforms as transforms
from PIL import Image


# Load a pre-trained YOLO model
model = torch.hub.load('ultralytics/yolov5', 'yolov5s', pretrained=True)


# Function to perform object detection
def detect_objects(image_path):
# Load and transform the image
image = Image.open(image_path)
transform = transforms.Compose([
transforms.ToTensor(),
])
image = transform(image).unsqueeze(0) # Add batch dimension


# Perform inference
model.eval() # Set the model to evaluation mode
with torch.no_grad():
predictions = model(image)


# Process predictions
# Note: The output format can vary, so adjust the processing as needed
for pred in predictions[0]:
bbox = pred[:4] # Bounding box coordinates
score = pred[4] # Confidence score
class_id = pred[5] # Class ID
print(f'Class: {class_id}, Score: {score}, BBox: {bbox}')


# Example usage
detect_objects('path/to/your/image.jpg')

此代碼片段提供了加載 YOLO 模型和執行對象檢測的基本框架。實際實現細節（例如處理輸出格式和置信度分數的閾值）將取決于所使用的 YOLO 的具體模型和版本。

訓練 YOLO 模型

學會觀察

訓練 YOLO 模型涉及一個獨特而復雜的過程，這主要是由于其獨特的輸出格式以及同時預測多個邊界框和類概率。此訓練過程的一個關鍵方面是 YOLO 采用的專門損失函數，該函數旨在有效地最小化預測任務不同部分之間的誤差。此損失函數通常包含幾個部分：

定位損失：損失函數的這一部分懲罰邊界框預測位置和大小的誤差。它通常關注預測邊界框坐標與地面真實坐標之間的差異，通常使用諸如平方誤差和之類的度量。
置信度損失：此組件懲罰邊界框置信度分數中的錯誤。置信度分數反映了模型對邊界框包含物體的確定性以及模型認為邊界框的準確度。對于包含物體的邊界框和不包含物體的邊界框，計算的損失不同，以幫助模型區分這兩種情況。
分類損失：損失函數的這一部分針對每個網格單元的類別概率預測。它通常涉及預測概率和獨熱編碼的真實類別標簽之間的分類交叉熵損失。

總損失是這些成分的加權和，平衡了定位、置信度和分類錯誤對整體訓練目標的貢獻。

代碼片段：YOLO 的訓練設置

下面是一個簡化的示例，演示了訓練 YOLO 模型的設置。此示例是概念性的，旨在說明配置訓練過程所涉及的關鍵組件，包括損失函數和優化。實際實施將根據 YOLO 的具體版本和所使用的深度學習框架而有所不同：

import torch
import torch.optim as optim


# Assuming yolo_model is your YOLO model and train_loader is your data loader


# Define the optimizer
optimizer = optim.Adam(yolo_model.parameters(), lr=0.001)


# Placeholder for the YOLO loss function
# Note: You'll need to define this based on the specific YOLO version and its output format
def yolo_loss(predictions, targets):
    # Compute localization loss, confidence loss, and classification loss
    # localization_loss = ...
    # confidence_loss = ...
    # classification_loss = ...
    
    # Combine the losses
    total_loss = localization_loss + confidence_loss + classification_loss
    return total_loss


# Training loop
for epoch in range(num_epochs):
    for images, targets in train_loader:  # Assuming targets contain ground truth
        optimizer.zero_grad()  # Zero the gradients
        
        # Forward pass
        predictions = yolo_model(images)
        
        # Compute loss
        loss = yolo_loss(predictions, targets)
        
        # Backward pass and optimize
        loss.backward()
        optimizer.step()
    
    print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item()}')

此代碼提供了設置 YOLO 模型訓練循環的基本框架，重點介紹了使用專門的損失函數來解決 YOLO 預測任務的獨特方面。實際損失函數的實現、優化器的選擇和其他訓練超參數可以根據任務和數據集的具體要求進行調整。

YOLO 實際應用：真實世界的應用

超越基礎

YOLO 物體檢測系統以其速度和準確性而聞名，使其成為需要實時處理和可靠檢測的眾多實際應用的理想選擇。它處理動態和具有挑戰性的環境的能力已在各個領域得到證實：

監控：YOLO 的實時處理能力在監控系統中特別有用，它可以同時檢測和跟蹤多個物體，例如個人、車輛或任何異常活動，從而增強公共和私人空間的安全措施。
自動駕駛：在自動駕駛汽車領域，YOLO 有助于完成檢測和分類汽車、行人和交通標志等物體的關鍵任務，使汽車能夠做出明智的決策并安全行駛。
野生動物監測：YOLO 已被用于野生動物監測項目，它有助于自動檢測和識別自然棲息地中的物種，協助保護工作和生物多樣性研究。
零售和庫存管理：在零售領域，YOLO 可以通過實時檢測和跟蹤貨架上的產品來簡化庫存管理，并可以通過交互式顯示和監控來增強客戶體驗。

代碼片段：將 YOLO 應用于視頻流

以下示例演示了如何使用 Python 應用預先訓練的 YOLO 模型來處理和顯示視頻流中的檢測結果。此示例使用 OpenCV 進行視頻處理，并假設使用基于 PyTorch 的 YOLO 模型：

import cv2
import torch


# Load the pre-trained YOLO model
model = torch.hub.load('ultralytics/yolov5', 'yolov5s', pretrained=True)


# Initialize the video stream (replace '0' with a video file path for processing a video file)
cap = cv2.VideoCapture(0)


while True:
    # Read frames from the video stream
    ret, frame = cap.read()
    if not ret:
        break


    # Convert the frame to the format expected by the model
    frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    results = model([frame_rgb], size=640)  # Adjust size as needed


    # Render the detections on the frame
    frame_with_detections = results.render()[0]


    # Convert the frame back to BGR for displaying with OpenCV
    frame_with_detections_bgr = cv2.cvtColor(frame_with_detections, cv2.COLOR_RGB2BGR)


    # Display the frame with detections
    cv2.imshow('YOLO Object Detection', frame_with_detections_bgr)


    # Break the loop when 'q' is pressed
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break


# Release the video stream and close windows
cap.release()
cv2.destroyAllWindows()

此代碼片段展示了 YOLO 在視頻流中實時檢測物體的簡單性和強大功能。通過高效處理視頻的每一幀并疊加檢測到的物體，YOLO 可幫助實現需要即時分析和響應的廣泛應用。

結論YOLO（You Only Look Once）的探索及其對物體檢測領域的變革性影響，凸顯了計算機視覺技術能力的重大飛躍。YOLO 的創新方法以單次檢測為特點，可以同時預測多個邊界框和類別概率，不僅提高了物體檢測的速度和效率，還擴大了其在各種現實場景中的適用性。

從通過先進的監控系統增強安全性到提高自動駕駛汽車的安全性和可靠性，從協助野生動物保護工作到徹底改變零售和庫存管理，YOLO 的多功能性和效率使其成為各個領域的基石技術。它能夠以驚人的準確性和速度處理動態和具有挑戰性的環境，這凸顯了深度學習模型在處理曾經無法實現的復雜實時任務方面的潛力。

提供的代碼片段深入了解了 YOLO 的架構、訓練過程和視頻流應用，證明了該模型的可訪問性和適應性。它們說明了如何在實際應用中集成和使用 YOLO，使開發人員和研究人員能夠在他們的項目中利用實時對象檢測的強大功能。

展望未來，YOLO 的持續開發和迭代有望取得更大進步，檢測精度、處理速度和對更廣泛應用的適應性都有可能得到改善。YOLO 從誕生到現在乃至更遠的未來，是人工智能和計算機視覺領域不懈追求創新的生動例證。它是未來發展的燈塔，鼓勵人們不斷探索，突破人工智能的極限。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

監控系統

監控系統

+關注

關注
21

文章
3860

瀏覽量
173498
人工智能

人工智能

+關注

關注
1791

文章
46859

瀏覽量
237577
代碼

代碼

+關注

關注
30

文章
4748

瀏覽量
68356

原文標題：縱觀全局：YOLO 助力實時物體檢測原理及代碼

文章出處：【微信號：vision263com，微信公眾號：新機器視覺】歡迎添加關注！文章轉載請注明出處。

華為云ModelArts入門開發(完成物體分類、物體檢測)

利用ModelArts框架可以完成圖像分類、物體檢測、預測分析、聲音分類、文本分類等功能。介紹如何使用ModelArts完成圖像分類、物體檢測、自我學習等功能運用。

發表于 07-10 16:26 ?1651次閱讀

華為云ModelArts入門開發(完成<b class='flag-5'>物體</b>分類、<b class='flag-5'>物體檢測</b>)

【EASY EAI Nano】RV1126實時讀取攝像頭并進行yolo檢測顯示

實現了三個并行模塊，分別是攝像頭讀取，使用opencv轉換到適合大小 yolo檢測托管到Qt進行現實檢測的DEMO從每幀10次改到每幀2次，可以看到還是具備一定實時性。

發表于 01-14 18:53

《DNK210使用指南 -CanMV版 V1.0》第四十一章 YOLO2物體檢測實驗

第四十一章 YOLO2物體檢測實驗在上一章節中，介紹了利用maix.KPU模塊實現YOLO2的人手檢測，本章將繼續介紹利用maix.KPU模塊實現

發表于 11-14 09:22

如何開始在斯巴達3e板上進行物體檢測和跟蹤

我如何開始在斯巴達3e板上進行物體檢測和跟蹤... plz幫助

發表于 05-26 08:46

請問超聲波人體檢測傳感器如何助力汽車行業穩步發展？

請問超聲波人體檢測傳感器如何助力汽車行業穩步發展？

發表于 06-16 06:40

設計一個紅外物體檢測設備

描述使用 PIR 傳感器的紅外物體檢測設備-PCB 設計項目背后的動機：這種物體檢測傳感器專門設計用于防止未經授權的物體或身體進入。在您不在的情況下，除非您允許，否則它不會讓任何人進入您的位置

發表于 06-27 06:18

基于運動估計的運動物體檢測技術研究

運動物體檢測是圖像處理和分析系統的關鍵技術，為了能夠更準確的檢測視頻流中的運動物體，本文提出了一種基于運動估計的運動物體檢測方法，該方法以運動估計過程中產生

發表于 12-14 13:37 ?16次下載

OH003 OH004的物體檢測電路圖

OH003 OH004的物體檢測電路圖

發表于 07-08 11:53 ?824次閱讀

自動化所在視覺物體檢測與識別領域取得系列進展

物體檢測是計算機視覺與模式識別領域的核心問題，一直以來受到學術界與工業界的廣泛關注。當前物體檢測最大的難點是如何對場景中多種尺度的物體進行有效表征，進而進行更為高效、更為準確、更為魯棒的物體檢

發表于 11-29 15:42 ?2668次閱讀

華為物體檢測系統助力智慧安防

華為發明的物體檢測方法，通過構建跨域知識圖譜，可以捕捉到不同待檢測物體間的內在關系，從而更加精確的進行物體識別，在智能安防等復雜場景中有著極其重要的應用。

發表于 11-22 09:19 ?2115次閱讀

一階段的物體檢測器，從直覺到細節的方方面面（一）

這篇文章非常詳細的講解了一階段物體檢測器的諸多細節和方方面面，并以yolo和ssd為例，非常細致的比較了兩者細節上的異同點，由于文章太...

發表于 01-26 19:32 ?4次下載

ESP32 CAM：遙控物體檢測攝像頭

電子發燒友網站提供《ESP32 CAM：遙控物體檢測攝像頭.zip》資料免費下載

發表于 12-15 09:56 ?2次下載

物體檢測人工智能機器人

電子發燒友網站提供《物體檢測人工智能機器人.zip》資料免費下載

發表于 06-19 14:38 ?1次下載

基于YOLO技術的植物檢測與計數

利用Roboflow平臺對數據進行有效的管理和標注。對于植物檢測，使用實時目標檢測能力強的YOLO方法。YOLO通過將輸入圖像劃分為網格并預

發表于 12-12 09:41 ?804次閱讀

使用OpenVINO C# API部署YOLO-World實現實時開放詞匯對象檢測

YOLO-World是一個融合了實時目標檢測與增強現實（AR）技術的創新平臺，旨在將現實世界與數字世界無縫對接。該平臺以YOLO（You Only Look Once）算法為核心，實現

發表于 08-30 16:27 ?550次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

縱觀全局：YOLO助力實時物體檢測原理及代碼

概念概述

YOLO 架構揭曉

從圖像到預測

代碼片段：加載和使用預訓練的 YOLO 模型

訓練 YOLO 模型

學會觀察

代碼片段：YOLO 的訓練設置

YOLO 實際應用：真實世界的應用

超越基礎

代碼片段：將 YOLO 應用于視頻流

評論

華為云ModelArts入門開發(完成物體分類、物體檢測)

【EASY EAI Nano】RV1126實時讀取攝像頭并進行yolo檢測顯示

《DNK210使用指南 -CanMV版 V1.0》第四十一章 YOLO2物體檢測實驗

如何開始在斯巴達3e板上進行物體檢測和跟蹤

請問超聲波人體檢測傳感器如何助力汽車行業穩步發展？

設計一個紅外物體檢測設備

基于運動估計的運動物體檢測技術研究

OH003 OH004的物體檢測電路圖

自動化所在視覺物體檢測與識別領域取得系列進展

華為物體檢測系統助力智慧安防

一階段的物體檢測器，從直覺到細節的方方面面（一）

ESP32 CAM：遙控物體檢測攝像頭

物體檢測人工智能機器人

基于YOLO技術的植物檢測與計數

使用OpenVINO C# API部署YOLO-World實現實時開放詞匯對象檢測