以圖搜圖

以圖搜圖

圖形圖像檢索
互聯網上圖像的數據信息日漸龐大,用戶對網上圖像搜索的要求也在不斷提高,使各種基于Web的圖像搜索引擎應運而生。以圖搜圖,是通過搜索圖像文本或者視覺特征,為用戶提供互聯網上相關圖形圖像資料檢索服務的專業搜索引擎系統,是搜索引擎的一種細分。通過輸入與圖片名稱或内容相似的關鍵字來進行檢索,另一種通過上傳與搜索結果相似的圖片或圖片URL進行搜索。[1]
    中文名:以圖搜圖 外文名: 适用領域: 所屬學科: 産生原因:互聯網上圖像的數據信息日漸龐大 基于:Web的圖像搜索引擎應運而生 可以滿足:我們的大多數需求

工作原理

圖像搜索引擎需要為在Web上浏覽過的圖像建立索引信息,能夠進行圖像分析和判别,為圖像加注釋,存儲抽取出的索引信息建立索引庫,理想的圖像搜索引擎還應該能支持基于内容的圖像檢索。

圖像識别方法

1、自動查找圖形文:可以通過兩個HTML标簽,即IMG SRC和HREF來檢測是否存在可顯示的圖像文件,IMG SRC表示“顯示下面的圖像文件”,而HREF則表示“下面是一個鍊接”,這兩種标簽經常導向一個圖像文件。搜索引擎通過檢查文件擴展名來判斷鍊接的是否是圖像文件。如果文件擴展名是.GIF或.JPG,那它就是一個可顯示的圖像。

2、人工幹預找出圖像并進行分類:即人工對網上的圖像及站點進行選擇。這種方法可以産生準确的查詢體系,但勞動強度太大,限制了處理圖像的數量。由于圖像不同于文本,需要人們按照各自的理解來說明其蘊含的意義,因此圖像檢索比起文本的查詢和匹配要困難得多。目前的圖像搜索引擎大多支持關鍵詞檢索和分類浏覽兩種檢索方式,部分可提供可視屬性檢索,但也很有限。它們主要的檢索途徑有以下幾種:

a. 基于圖像外部信息:即根據圖像的文件名或目錄名、路徑名、鍊路、ALT标簽以及圖像周圍的文本信息等外部信息進行檢索,這是目前圖像搜索引擎采用最多的方法。在找出圖像文件後,圖像搜索引擎通過查看文件名或路徑名确定文件内容,但這取決于文件名或路徑名的描述程度。

b. 基于圖像内容特征描述:這是一種語義層次的匹配。需要人工對圖像的内容(如物體、背景、構成、顔色特征等)進行描述并分類,給出描述詞。檢索時,将主要在這些描述詞中搜索你的檢索詞。這種查詢方式是比較準确的,一般來講可以獲得較好的查準率。但需人工參與,勞動強度大,因而限制了可處理的圖像數量,并且需要一定的規範和标準,效果取決于人工描述的精确度。

c. 基于圖像形式特征的抽取:由圖像分析軟件自動抽取圖像的顔色、形狀、紋理等特征,建立特征索引庫,用戶隻需将要查找的圖像的大緻特征描述出來,就可以找出與之具有相近特征的圖像。這是一種基于圖像特征層次的機械匹配,特别适用于檢索目标明确的查詢要求(例如對商标的檢索)。産生的結果也是最接近用戶要求的。但目前這種較成熟的檢索技術主要應用于圖像數據庫的檢索,在網上圖像搜索引擎中應用這種檢索技術還具有一定的困難。

相關技術

從廣義上講,圖像的特征包括基于文本的特征(如關鍵字、注釋等)和視覺特征(如顔色、紋理、形狀等)兩類。視覺特征又可分為通用的視覺特征和領域相關(局部/專用)的視覺特征。前者用于描述所有圖像共有的特征,與圖像的具體類型或内容無關,主要包括顔色、紋理和形狀;後者則建立在對所描述圖像内容的某些先驗知識(或假設)的基礎上,與具體的應用緊密有關,例如人的面部特征或指紋特征等。

1、基于上下文本(context)的圖片搜索

通常是通過Alt等錨來索引,搜索的,您可以訪問搜索引擎,比如百度、GOOGLE。在搜索框内輸入搜索文字,點擊右側的“圖片搜索”按紐,即可獲得相關圖片搜索結果。

2、基于圖片内容的搜索

涉及了數據庫管理、計算機視覺、圖像處理、模式識别、信息檢索和認知心理學等諸多學科,其相關技術主要包括:圖像數據模型、特征提取方法、索引結構、相似性度量、查詢表達模式、檢索方法等。相似圖片的檢測主要涉及特征表示和相似性度量這兩類關鍵技術。圖像特征的提取與表達是基于内容的圖像處理技術的基礎。

搜圖引擎

目前湧現很多以圖搜圖的搜索引擎,包括百度的識圖搜索,安圖搜的購物搜索引擎,Google的以圖搜圖,淘寶也推出以圖搜圖了等等。

搜圖應用

以圖搜圖已成為一種新的搜索趨勢; 各大搜索引擎廠商均推出了使用圖片搜索的功能,以圖搜圖主要應用在以下兩方面:

1、同款比價購物搜索引擎:目前全球使用這種方式的網站有:安圖搜,用戶可以通過上傳圖片進行全網同款或者相似商品的搜索和比價。

2、圖片搜索:目前國内有百度識圖、搜狗、谷歌等網站,用戶通過上傳圖片進行全網同圖片或者相似圖片的搜索。

相關詞條

相關搜索

其它詞條