圖像分割

圖像分割

數字圖像細分為多個圖像子區域的過程
在計算機視覺領域,圖像分割(Segmentation)指的是将數字圖像細分為多個圖像子區域(像素的集合)(也被稱作超像素)的過程。圖像分割的目的是簡化或改變圖像的表示形式,使得圖像更容易理解和分析。圖像分割通常用于定位圖像中的物體和邊界(線,曲線等)。更精确的,圖像分割是對圖像中的每個像素加标簽的一個過程,這一過程使得具有相同标簽的像素具有某種共同視覺特性。[1]
  • 中文名:圖像分割
  • 外文名:
  • 别名:
  • 英文名:image segmentation
  • 分割方法:阈值分割等
  • 用途:圖像語義識别,圖像搜索
  • 類型:計算機技術
  • 學科:跨學科
  • 發展實踐:1998

基本簡介

圖像分割是圖像識别和計算機視覺至關重要的預處理。沒有正确的分割就不可能有正确的識别。但是,進行分割僅有的依據是圖像中像素的亮度及顔色,由計算機自動處理分割時,将會遇到各種困難。

例如,光照不均勻、噪聲的影響、圖像中存在不清晰的部分,以及陰影等,常常發生分割錯誤。因此圖像分割是需要進一步研究的技術。人們希望引入一些人為的知識導向和人工智能的方法,用于糾正某些分割中的錯誤,是很有前途的方法,但是這又增加了解決問題的複雜性。

在通信領域中,圖像分割技術對可視電話等活動圖像的傳輸很重要,需要把圖像中活動部分與靜止的背景分開,還要把活動部分中位移量不同的區域分開,對不同運動量的區域用不同的編碼傳輸,以降低傳輸所需的碼率。

分割方法

阈值分割

灰度阈值分割法是一種最常用的并行區域技術,它是圖像分割中應用數量最多的一類。阈值分割方法實際上是輸入圖像f到輸出圖像g的如下變換:

其中,T為阈值,對于物體的圖像元素g(i,j)=1,對于背景的圖像元素g(i,j)=0。

由此可見,阈值分割算法的關鍵是确定阈值,如果能确定一個合适的阈值就可準确地将圖像分割開來。阈值确定後,将阈值與像素點的灰度值逐個進行比較,而且像素分割可對各像素并行地進行,分割的結果直接給出圖像區域。

阈值分割的優點是計算簡單、運算效率較高、速度快。在重視運算效率的應用場合(如用于硬件實現),它得到了廣泛應用。

在許多情況下,物體和背景的對比度在圖像中的各處不是一樣的,這時很難用一個統一的阈值将物體與背景分開。這時可以根據圖像的局部特征分别采用不同的阈值進行分割。實際處理時,需要按照具體問題将圖像分成若幹子區域分别選擇阈值,或者動态地根據一定的鄰域範圍選擇每點處的阈值,進行圖像分割。這時的阈值為自适應阈值。

阈值的選擇需要根據具體問題來确定,一般通過實驗來确定。對于給定的圖像,可以通過分析直方圖的方法确定最佳的阈值,例如當直方圖明顯呈現雙峰情況時,可以選擇兩個峰值的中點作為最佳阈值。

邊緣分割

圖像分割的一種重要途徑是通過邊緣檢測,即檢測灰度級或者結構具有突變的地方,表明一個區域的終結,也是另一個區域開始的地方。這種不連續性稱為邊緣。不同的圖像灰度不同,邊界處一般有明顯的邊緣,利用此特征可以分割圖像。

圖像中邊緣處像素的灰度值不連續,這種不連續性可通過求導數來檢測到。對于階躍狀邊緣,其位置對應一階導數的極值點,對應二階導數的過零點(零交叉點)。因此常用微分算子進行邊緣檢測。

于邊緣和噪聲都是灰度不連續點,在頻域均為高頻分量,直接采用微分運算難以克服噪聲的影響。因此用微分算子檢測邊緣前要對圖像進行平滑濾波。

LoG算子和Canny算子是具有平滑功能的二階和一階微分算子,邊緣檢測效果較好,如圖4所示。其中loG算子是采用Laplacian算子求高斯函數的二階導數,Canny算子是高斯函數的一階導數,它在噪聲抑制和邊緣檢測之間取得了較好的平衡。

直方圖法

與其他圖像分割方法相比,基于直方圖的方法是非常有效的圖像分割方法,因為他們通常隻需要一個通過像素。在這種方法中,直方圖是從圖像中的像素的計算,并在直方圖的波峰和波谷是用于定位圖像中的簇。顔色和強度可以作為衡量。

基于直方圖的方法也能很快适應于多個幀,同時保持他們的單通效率。直方圖可以在多個幀被考慮的時候采取多種方式。同樣的方法是采取一個框架可以應用到多個,和之後的結果合并,山峰和山谷在以前很難識别,但現在更容易區分。

直方圖也可以應用于每一個像素的基礎上,将得到的信息被用來确定的像素點的位置最常見的顔色。這種方法部分基于主動對象和一個靜态的環境,導緻在不同類型的視頻分割提供跟蹤。

應用領域

1.機器視覺

2.人臉識别

3.指紋識别

4.交通控制系統

5.在衛星圖像中定位物體(道路、森林等)

6.行人檢測

7.醫學影像,包括:腫瘤和其他病理的定位、組織體積的測量、計算機引導的手術、診斷治療方案的定制、解剖學結構的研究等

相關詞條

相關搜索

其它詞條