人機交互技術:通過計算機輸入輸出設備實現人與計算機對話-中文百科頻道

基本内容

人機交互技術(Human-Computer Interaction Techniques)是指通過計算機輸入、輸出設備，以有效的方式實現人與計算機對話的技術。它包括機器通過輸出或顯示設備給人提供大量有關信息及提示請示等，人通過輸入設備給機器輸入有關信息及提示請示等，人通過輸入設備給機器輸入有關信息，回答問題等。人機交互技術是計算機用戶界面設計中的重要内容之一。它與認知學、人機工程學、心理學等學科領域有密切的聯系。

行業特征

市場需求是很大的，而供應方面卻略顯不足，尤其是擁有核心自主知識産權，技術過硬的企業并不多，行業整體缺乏品牌效應。傲唯刃道号召業内企業共同努力，尤其發揮吹毛求疵的研發精神，進一步提高研發能力，降低成本，真正解決客戶的實際困難，嚴把質量關，提供最可靠的産品和技術。

發展曆史

市場需求是很大的，而供應方面卻略顯不足，尤其是擁有核心知識産權，技術過硬的企業并不多，行業整體缺乏品牌效應。

⒈WIMP界面的形成

Xerox Palo研究中心于70年代中後期研制出原型機Star，形成了以窗口（Windows）、菜單（Menu）、圖符（Icons）和指示裝置（Pointing Devices）為基礎的圖形用戶界面，也稱WIMP界面。

Apple最先采用了這種圖形界面，斯坦福研究所60年代的發展計劃也對WIMP界面的發展産生了重要的影響。該計劃強調增強人的智能，把人而不是技術放在了人機交互的中心位置。該計劃的結果導緻了許多硬件的發明，衆所周知的鼠标就是其中之一。

⒉WIMP界面面臨的問題和發展多媒體計算機和VR系統的出現，改變了人與計算機通信的方式和要求，使人機交互發生了很大的變化。在多媒體系統中繼續采用WIMP界面有其内在的缺陷：随着多媒體軟硬件技術的發展，在人機交互界面中計算機可以使用多種媒體，而用戶隻能同時用一個交互通道進行交互因而從計算機到用戶的通信帶寬要比從用戶到計算機的大得多，這是一種不平衡的人-計算機交互。

虛拟現實技術除了要求有高度自然的三維人機交互技術外，由于受交互裝置和交互環境的影響，不可能也不必要對用戶的輸入做精确的測量，而是一種非精确的人機交互。三維人機交互技術在科學計算可視化和三維CAD系統中占有重要的地位。基于WIMP技術的圖形用戶界面，從本質上講，是一種二維交互技術，不具有三維直接操作的能力。要從根本上改變這種不平衡的通信，人機交互技術的發展必須适應從精确交互向非精确交互、從單通道交互向多通道交互以及從二維交互向三維交互的轉變，發展用戶與計算機之間快速、低耗的多通道界面。從右上表可以看出在計算機系統不同的發展階段中，人機交互模型的發展過程。在傳統的人機系統中，人被認為是操作員，隻是對機器進行操作，而無真正的交互活動。在計算機系統中人還是被稱為用戶。隻有在VR系統中的人才，是主動的參與者。

人類生活中的事件都是多通道的，人-計算機多通道交互技術的發展雖然受到軟件和硬件的限制，但至少要滿足兩個條件：其一，多通道整合，不同通道的結合對用戶的體驗是十分重要的；其二，在交互中容許用戶産生含糊和不精确的輸入。

⒈非精确的交互

語音（Voice)主要以語音識别為基礎，但不強調很高的識别率，而是借助其它通道的約束進行交互。

姿勢（Gesture)主要利用數據手套、數據服裝等裝置，對手和身體的運動進行跟蹤，完成自然的人機交互。

頭部跟蹤（HeadTracking）主要利用電磁、超聲波等方法，通過對頭部的運動進行定位交互。

視覺跟蹤（Eye-Tracking）對眼睛運動過程進行定位的交互方式。

⒉多通道交互的體系結構

多通道交互的體系結構首先要能保證對多種非精确的交互通道進行綜合，使多通道交互存在于一個統一的用戶界面之中，同時，還要保證這種通道的綜合在交互過程中的任何時候都能進行。圖1和圖2表示了這兩種不同的體系結構。良好的體系結構應能保證多個通道的綜合不隻是發生在應用程序這一級。

人機交互技術是目前用戶界面研究中發展得最快的領域之一，對此，各國都十分重視。美國在國家關鍵技術中，将人機界面列為信息技術中與軟件和計算機并列的六項關鍵技術之一，并稱其為"對計算機工業有着突出的重要性，對其它工業也是很重要的"。在美國國防關鍵技術中,人機界面不僅是軟件技術中的重要内容之一，而且是與計算機和軟件技術并列的11項關鍵技術之一。歐共體的歐洲信息技術研究與發展戰略計劃（ESPRIT）還專門設立了用戶界面技術項目，其中包括多通道人機交互界面（MultiModal Interface for Man-MachineInterfa

ce）。保持在這一領域中的領先，對整個智能計算機系統是至關重要的。我們可以以發展新的人機界面交互技術為基礎，帶動和引導相關的軟硬件技術的發展，使更有效地使用計算機的計算處理能力成為可能。

研究現狀

目前，人機交互技術正處于多通道、多媒體的智能人機交互階段，已經取得了不少研究成果，不少産品已經問世。側重多媒體技術的有：觸摸式顯示屏實現的“桌面”計算機，能夠随意折疊的柔性顯示屏制造的電子書，從電影院搬進客廳指日可待的3D顯示器，使用紅綠藍光激光二極管的視網膜成像顯示器；側重多通道技術的有：“漢王筆”手寫漢字識别系統，結合在微軟的Tablet PC操作系統中數字墨水技術，廣泛應用于Office/XP的中文版等辦公、應用軟件中的IBM/Via Voice連續中文語音識别系統，輸入設備為攝像機、圖像采集卡的手勢識别技術，以IPHONE手機為代表的可支持更複雜的姿勢識别的多觸點式觸摸屏技術，以及IPHONE中基于傳感器的捕捉用戶意圖的隐式輸入技術。

人機交互技術領域熱點技術的應用潛力已經開始展現，比如智能手機配備的地理空間跟蹤技術，應用于可穿戴式計算機、隐身技術、浸入式遊戲等的動作識别技術，應用于虛拟現實、遙控機器人及遠程醫療等的觸覺交互技術，應用于呼叫路由、家庭自動化及語音撥号等場合的語音識别技術，對于有語言障礙的人士的無聲語音識别，應用于廣告、網站、産品目錄、雜志效用測試的眼動跟蹤技術，針對有語言和行動障礙人開發的“意念輪椅”采用的基于腦電波的人機界面技術等。熱點技術的應用開發是機遇也是挑戰，基于視覺的手勢識别率低，實時性差，需要研究各種算法來改善識别的精度和速度，眼睛虹膜、掌紋、筆迹、步态、語音、唇讀、人臉、DNA等人類特征的研發應用也正受到關注，自然語言理解雖然目前在語言模型、語料庫等方面有進展外，仍将是人機交互的重要目标，多通道的整合也是人機交互的熱點，另外，與“無所不在的計算”、“雲計算”等相關技術的融合與促進也需要繼續探索。

主要特點

多媒體系統的交互特點

與傳統用戶界面相比，引入了視頻和音頻之後的多媒體用戶界面，最重要的變化就是界面不再是一個靜态界面，而是一個與時間有關的時變媒體界面。

人類使用語言和其它時變媒體（如姿勢）的方式完全不同于其它媒體。從向用戶呈現的信息來講，時變媒體主要是順序呈現的，而我們通常熟悉的視覺媒體（文本和圖形）通常是同時呈現的。在傳統的靜止界面中，用戶或是從一系列選項中進行選擇（明确的界面通信成分），或是用可再認的方式進行交互（隐含的界面通信成分）。在時變媒體的用戶界面中，所有選項和文件必須順序呈現。由于媒體帶寬和人的注意力的限制,在時變媒體中，用戶不僅要控制呈現信息的内容，也必須控制何時呈現和如何呈現。

VR系統中人機交互的特點

人機交互可以說是VR系統的核心，因而，VR系統中人機交互的特點是所有軟硬件設計的基礎。其特點如下：

觀察點（Viewpoint)是用戶做觀察的起點。

導航（Navigation)是指用戶改變觀察點的能力。

操作（Manipulation）是指用戶對其周圍對象起作用的能力。

臨境（Immersion)是指用戶身臨其境的感覺，這在VR系統中越來越重要。

VR系統中人機交互若要具備這些特點，就需要發展新的交互裝置，其中包括三維空間定位裝置、語言理解、視覺跟蹤、頭部跟蹤和姿勢識别等。

多媒體與VR系統的人機交互有着某些共同特點。首先，它們都是使用多個感覺通道，如視覺和聽覺；其次，它們都是時變媒體。

人機交互界面作為一個獨立的、重要的研究領域受到了世界各計算機廠家的關注。并成為90年代計算機行業的又一競争領域。從計算機技術的發展過程來看，人機交互界面技術還引導了相關軟硬件技術的發展，是新一代計算機系統取得成功的保證。80年代已來，計算機的軟件和硬件技術取得了較大的發展，同時，計算機的使用者也從計算機專家迅速擴大到了廣大未受過專門訓練的普通用戶，由此極大地提高了用戶界面在系統設計和軟件開發中的重要性，強烈地刺激了人機交互界面的進步。人－計算機的交互作用是通過用戶界面來實現的。

圖形用戶界面

介于人與計算機之間,人與機器的通信，人機界面(HCI):軟件+硬件

發展:

由指示燈和機械開關組成的操縱界面->由終端和鍵盤組成的字符界面(80年代)->由多種輸入設備和光栅圖形顯示設備構成的圖形用戶界面(GUI)，(90年代)PC，工作站，WIMP(W-windows、I-icons、M-menu、P-pointing devices)界面，所見即所得->VR技術(發展方向)

由計算機發展決定:

科學計算機型->無處不在的計算機，人機溶合，提高交互效率。

什麼是HCI

HCI是設計、評估和執行交互計算機系統以及研究由此而發生的相關現象的。

HCI是未來的計算機科學。我們已經花費了至少50年的時間來學習如何制造計算機以及如何編寫計算機程序。下一個新領域自然是讓計算機服務并适應于人類的需要，而不是強近人類去适應計算機。

多媒體人機交互技術

人機交互:

Human Computer Interaction,是研究人與計算機之間交互的技術。

多媒體人機交互技術概述:

多媒體人機交互技術是多媒體技術和人機交互技術的結合。

信息表示的多樣化和如何通過多種輸入輸出設備與計算機進行交互是多媒體人機交互技術的重要内容。

多媒體人機交互是基于視線跟蹤、語音識别、手勢輸入、感覺反饋等新的交互技術。

人機界面:

User Interface，又稱用戶界面，是計算機與人之間交流的接口。

人機界面的發展

手工操作:最早的計算機采用

命令通行無阻:DOS等操作系統采用

圖形用戶界面:Windows系列采用

人機界面的設計和開發在整個系統的研制中占40%~60%的比重。

多媒體人機交互方式:

輸入

鍵盤輸入:傳統方式

鼠标輸入:圖形用戶界面的重要輸入方式

手寫輸入:手寫漢字識别,平闆電腦

語音輸入

觸摸屏輸入

數字化儀輸入:适用于CAD/CAM系統

掃描輸入:條形碼、掃描儀、光電閱讀器

三維輸入：數據手套、三維鼠标、力矩球等

視覺輸入：攝像設備。機器人的視覺

輸出

顯示終端輸出：重要工具。

聲響輸出：聲波

打印輸出：标準輸出設備之一

三維輸出：産生三維輸出的設備有投影顯示器、頭盔顯示器、電視眼境等

多媒體人機交互技術應用領域

軟件界面設計：多媒體化

自然語言人機交互

輸入輸出裝置的設計

計算機輔助設計和制造(Computer Aided design CAD/Computer aided manufacturing CAM)

什麼是理想人機交互技術

人機交互技術幾十年來經曆了幾個不同的主要發展階段和典型風格。當前，占統治地位的圖形用戶界面(WIMP/GUI)正遭受不斷的批評，而新的交互技術尚不成熟和普及，于是人們更為熱衷于争論未來的人機界面“可能是什麼樣子”而且莫衷一是。在此，我們也想加入這種讨論的行列，根據幾年來研究工作的心得發表一些看法，談談什麼是理想人機交互風格。我們的出發點處于人機工程學這個大背景，遵循人機工程學的基本觀點，在“以人為中心”前提下強調人機配合

讓我們先考察在人機工程學出現之前人類如何對待工具。不管某個具體工具的設計者在某個具體時期如何理解人與工具的關系，就人類勞動(尤其是制造和使用工具)的曆史長河而言，人類是在努力不懈地改造和馴服自然，而工具的制造和完善都是在服從這種目的的前提下進行的。就使用特定工具是否需要經過訓練以及所需訓練的程度如何，也是不一而論的。人的技能有簡單與複雜之分，也許人人都能學會打字，但未必人人都能學會駕駛航天飛機。

較為合理的看法是“自然人機交互是利用人的日常技能進行的”，強調無需特别訓練或不需要訓練。但究竟什麼是“日常技能”以及日常技能是否都是不經訓練或稍作訓練即可獲得呢?語言(特别是書面語言)是必須經過訓練的，音樂、繪畫、生産工藝等莫不如此。我們認為，人從日常環境走向計算環境時原本具有的技能便是所謂的“日常技能”。可見這是一個相對的概念，其中并不細究是否需訓練的問題。

所以我們不能以是否需要訓練來衡量人機交互技術的好壞。人機工程學并不否定訓練，避免訓練或減少訓練是人們的願望，但能否做到并不完全由人的主觀意志決定，應根據人機交互任務的目的、特點、場合以及實現成本等因素來決定人機交流應達到的自然性程序。

也許對于早期的“純粹”的計算機問題和為數極少的計算機專家而言，命令語言及程序語言界面是足夠的。但是當計算機大量應用于CAD/CAM、字處理、MIS等非數值計算領域之後，需要進行大量幾何的、空間的、非數值的、非符号的信息處理手段，此時形式語言界面的複雜性、抽象性，對記憶負荷要求等限制了計算機應用的深入和普及，随之直接操縱給用戶界面技術應運而生并廣受歡迎。我們相信，形式語言不會消失，當然也不能強迫所有用戶都接受它。

這正如數學語言并不會被其它形式的語言(如圖形的、手勢的)所取代，雖然心理學家嘗試在數學教育中大量利用非數學手段；又如流行音樂與高雅音樂各分秋色，聽衆各有所好。目前，直接操縱界面不但沒有徹底取代形式語言界面，而且其自身也表現出許多局限性。

而基于語言的對話式交互方式又重新開始受到重視，隻是對話語言不再限于單純的形式語言，而是引入了自然語言或類自然語言對話，如所謂的第四代語言，甚至引入基于語音的人機對話。基于形式語言、自然語言或類自然語言的用戶界面本質上都是命令驅動的，其基本模式與直接操作用戶界面相反。

這兩種本質不同的人機交互模式在人類的日常活動中都存在其對應的形式，分别對應于語言的和非語言的交際活動，後者泛指形體語言，包括姿勢，情态、觸摸、近體、标志等。語言具有後天習得性，有口頭語言和書面語言兩種，書面語言需要正規和專門的教育和訓練才能掌握。

我們認為，自然人機交互模式是以直接操縱為主的、與命令語言特别是自然語言共存的人機交互形式。理想的人機交互模式就是“用戶自由”。