伟易博娱乐场官网博彩资讯,新加坡博彩专业就业,青岛够级棋牌下载(中国)·官方网站

在人工智能和圖像處理的迷人世界中，這些概念在使機器能夠像我們的眼睛一樣感知我們周圍的三維世界中起著關鍵作用。和我們一起探索立體視覺和深度感知背后的技術，揭示計算機如何從二維圖像中獲得深度、距離和空間理解的秘密。

計算機視覺中的立體視覺和深度感知是什么？

立體視覺和深度感知是計算機視覺中的重要概念，旨在模仿人類從視覺信息中感知深度和三維結構的能力。它們通常用于機器人技術、自動駕駛汽車和增強現實等應用中。

立體視覺

立體視覺，也稱為立體視或雙目視覺，是一種通過捕獲和分析稍微分開放置的兩個或多個攝像頭的圖像來感知場景深度的技術，模仿了人眼的工作方式。

立體視覺背后的基本原理是三角測量。當兩個攝像頭（或“立體攝像頭”）從稍微不同的視點捕獲相同場景的圖像時，生成的圖像對稱為立體對，其中包含兩個圖像中相應點的位置差異或差異。

通過分析這些差異，計算機視覺系統可以計算場景中物體的深度信息。靠近攝像頭的物體將具有較大的差異，而遠離攝像頭的物體將具有較小的差異。

立體視覺算法通常涉及諸如特征匹配、差異映射和極線幾何等技術，以計算深度圖或場景的3D表示。

深度感知

計算機視覺中的深度感知是指系統能夠從單個或多個2D圖像或視頻幀中理解和估計3D場景中物體的距離能力。

除了立體視覺外，深度感知可以使用其他方法實現，包括：

單眼線索：這些是可以在單個攝像頭或圖像中感知的深度線索。例如，透視、紋理梯度、陰影和遮擋等示例。即使在沒有立體視覺的情況下，這些線索也可以幫助估算深度。

LiDAR（光探測與測距）：LiDAR傳感器使用激光束來測量場景中物體的距離，提供點云形式的精確深度信息。這些信息可以與視覺數據融合，以獲得更準確的深度感知。

結構光：結構光涉及將已知圖案投射到場景上，并分析該圖案在場景中的物體上的變形。這種變形可用于計算深度信息。

飛行時間（ToF）攝像頭：ToF攝像頭測量光線從物體反射并返回到攝像頭所需的時間。這些信息用于估算深度。

在計算機視覺應用中，深度感知對于障礙物避免、物體識別、3D重建和場景理解等任務至關重要。

計算機視覺中的立體視覺和深度感知組件

立體攝像頭：立體視覺依賴于兩個或多個相機（立體攝像頭），這些相機相距已知的距離放置。這些相機從稍微不同的視點捕獲相同場景的圖像，模擬人眼感知深度的方式。

圖像捕獲：相機捕獲場景的圖像或視頻幀。這些圖像通常被稱為左圖像（來自左相機）和右圖像（來自右相機）。

校準：為了準確計算深度信息，必須對立體攝像頭進行校準。這個過程涉及確定攝像頭參數，如內在矩陣、畸變系數和外在參數（攝像頭之間的旋轉和平移）。校準確保來自兩個相機的圖像能夠正確進行校正和匹配。

校正：校正是應用于捕獲的圖像的幾何變換，以對齊極線上的相應特征。這通過使差異更可預測來簡化立體匹配過程。

立體匹配：立體匹配是在左圖像和右圖像之間找到對應點或匹配點的過程。用于計算每個像素的差異的像素值被稱為差異，表示圖像中特征的水平偏移。有各種立

體匹配算法可供選擇，包括塊匹配、半全局匹配和圖割，用于找到這些對應點。

差異圖：差異圖是一幅灰度圖像，其中每個像素的強度值對應于場景中該點的差異或深度。靠近相機的物體具有較大的差異，而遠離相機的物體具有較小的差異。

深度圖：深度圖是通過使用已知的基線（相機之間的距離）和相機的焦距來從差異圖中導出的。它計算每個像素的實際世界單位（例如米）的深度，而不是差異。

可視化：深度和差異圖通常可視化，以提供場景的3D結構的可讀人類表示。這些圖可以顯示為灰度圖像，也可以轉換為點云以進行3D可視化。

一些硬件：除了攝像頭外，還可以使用深度感知攝像頭（例如Microsoft Kinect、Intel RealSense）或LiDAR（光探測與測距）傳感器等專用硬件來獲取深度信息。這些傳感器直接提供深度，無需立體匹配。

計算機視覺中的立體視覺和深度感知Python示例實現

import cv2
import numpy as np


# Create two video capture objects for left and right cameras (adjust device IDs as needed)
left_camera = cv2.VideoCapture(0)
right_camera = cv2.VideoCapture(1)


# Set camera resolution (adjust as needed)
width = 640
height = 480
left_camera.set(cv2.CAP_PROP_FRAME_WIDTH, width)
left_camera.set(cv2.CAP_PROP_FRAME_HEIGHT, height)
right_camera.set(cv2.CAP_PROP_FRAME_WIDTH, width)
right_camera.set(cv2.CAP_PROP_FRAME_HEIGHT, height)


# Load stereo calibration data (you need to calibrate your stereo camera setup first)
stereo_calibration_file = ‘stereo_calibration.yml’
calibration_data = cv2.FileStorage(stereo_calibration_file, cv2.FILE_STORAGE_READ)


if not calibration_data.isOpened():
print(“Calibration file not found.”)
exit()


camera_matrix_left = calibration_data.getNode(‘cameraMatrixLeft’).mat()
camera_matrix_right = calibration_data.getNode(‘cameraMatrixRight’).mat()
distortion_coeff_left = calibration_data.getNode(‘distCoeffsLeft’).mat()
distortion_coeff_right = calibration_data.getNode(‘distCoeffsRight’).mat()
R = calibration_data.getNode(‘R’).mat()
T = calibration_data.getNode(‘T’).mat()


calibration_data.release()


# Create stereo rectification maps
R1, R2, P1, P2, Q, _, _ = cv2.stereoRectify(
camera_matrix_left, distortion_coeff_left,
camera_matrix_right, distortion_coeff_right,
(width, height), R, T
)


left_map1, left_map2 = cv2.initUndistortRectifyMap(
camera_matrix_left, distortion_coeff_left, R1, P1, (width, height), cv2.CV_32FC1
)
right_map1, right_map2 = cv2.initUndistortRectifyMap(
camera_matrix_right, distortion_coeff_right, R2, P2, (width, height), cv2.CV_32FC1
)


while True:
# Capture frames from left and right cameras
ret1, left_frame = left_camera.read()
ret2, right_frame = right_camera.read()


if not ret1 or not ret2:
print(“Failed to capture frames.”)
break


# Undistort and rectify frames
left_frame_rectified = cv2.remap(left_frame, left_map1, left_map2, interpolation=cv2.INTER_LINEAR)
right_frame_rectified = cv2.remap(right_frame, right_map1, right_map2, interpolation=cv2.INTER_LINEAR)


# Convert frames to grayscale
left_gray = cv2.cvtColor(left_frame_rectified, cv2.COLOR_BGR2GRAY)
right_gray = cv2.cvtColor(right_frame_rectified, cv2.COLOR_BGR2GRAY)


# Perform stereo matching to calculate depth map (adjust parameters as needed)
stereo = cv2.StereoBM_create(numDisparities=16, blockSize=15)
disparity = stereo.compute(left_gray, right_gray)


# Normalize the disparity map for visualization
disparity_normalized = cv2.normalize(disparity, None, alpha=0, beta=255, norm_type=cv2.NORM_MINMAX, dtype=cv2.CV_8U)


# Display the disparity map
cv2.imshow(‘Disparity Map’, disparity_normalized)


if cv2.waitKey(1) & 0xFF == ord(‘q’):
break


# Release resources
left_camera.release()
right_camera.release()
cv2.destroyAllWindows()