Siri

Siri

蘋果智能語音助手
Siri 是 Speech Interpretation & Recognition Interface 的首字母縮寫,原義為語音識别接口,是蘋果公司在iPhone、iPad、iPod Touch、HomePod等産品上應用的一個語音助手,利用Siri用戶可以通過手機查找信息、撥打電話、發送信息、獲取路線、播放音樂、查找蘋果設備等。[2]Siri可以支持自然語言輸入,并且可以調用系統自帶的天氣預報、日程安排、搜索資料等應用,還能夠不斷學習新的聲音和語調,提供對話式的應答。Siri可以令iPhone4S及以上手機(iPad 3以上平闆)變身為一台智能化機器人。2016年6月13日,在蘋果開發者大會WWDC發布了産品Siri的新功能。2017年蘋果WWDC開發者大會上,Siri的更新當中,加入了實時翻譯功能,支持英語、法語、德語等語言,未來将陸續進行支持,與此同時,Siri的智能化還進一步得到提升,支持上下文的預測功能,類似此前發布的谷歌助手,用戶甚至可以用Siri作為Apple TV的遙控器。2022年2月,抖音搜索與蘋果Siri達成合作。
  • 中文名:siri
  • 外文名:
  • 别名:
  • 軟件類型:語音助手
  • 發布時間:2007年
  • 類似軟件:Google Now 、 Cortana

基本介紹

研究背景

Siri成立于2007年,2010年被蘋果以2億美金收購,最初是以文字聊天服務為主,随後通過與全球最大的語音識别廠商Nuance合作,Siri實現了語音識别功能。

技術來源

Siri 技術來源于美國國防部高級研究規劃局所公布的 CALO 計劃:一個讓軍方簡化處理一些繁複庶務,并具學習、組織以及認知能力的數字助理,其所衍生出來的民用版軟件 Siri 虛拟個人助理。

支持設備

原生:

iPhone 4S

iPhone 5

iPhone 5C

iPhone 5S

iPhone 6

iPhone 6 Plus

iPhone 6S

iPhone 6S Plus

iPhone SE

iPhone 7

iPhone 7 Plus

iPhone 8

iPhone 8 Plus

iPhone X

iPhone XS

iPhone XS Max

iPhone XR

iPhone 11

iPhone 11 Pro

iPhone 11 Pro Max

iPhone SE(第二代)

iPhone 12 mini

iPhone 12

iPhone 12 Pro

iPhone 12 Pro Max

iPhone 13 mini

iPhone 13

iPhone 13 Pro

iPhone 13 Pro Max

iPad3

iPad4

iPad mini

iPad mini 2

iPad mini 3

iPad mini 4

iPad mini 5

iPad Air

iPad Air 2

iPad Air 3

iPad Air 4

iPad Pro

iPod touch 5

iPod touch 6

iPod touch 7

HomePod

HomePod mini

注:iPhone4S的Siri支持中文需要iOS 6.0(或更高版本)

The new iPad支持Siri需要iOS6.0(或更高版本)

以及任何iPhone 4s 和 iPad 升級至iOS 6.0(或更高版本)的設備

Apple Watch 任何版本均支持Siri

越獄後:

iPhone 3GS

iPod touch 4

iPhone 4

iPad 1

以及任何iPhone 4s 和 iPad 升級至iOS 7.0之後的設備

注:1.越獄後是利用Siri Proxy 中轉接入蘋果官方服務器或FeelSiri服務器。

2.iPhone 3GS 和 iPod touch 4 支持iOS 5和iOS 6 系統下的Siri移植。由于iOS 7 不支持這兩款設備,故不能移植。

3.iPhone 4 除支持iOS 5和iOS 6 外,因為可以升級iOS 7。不排除iOS 7移植Siri可能。

4. iPad 1 可以在IOS 5下移植Siri。由于不能升級iOS 6和iOS 7 故不能移植。

5.除iPad 1不是完美GUI移植。在iOS 6 環境下,iPad 2完成了完美GUI移植。

功能介紹

使用者可以通過聲控、文字輸入的方式,來搜尋餐廳、電影院等生活信息,同時也可以直接收看各項相關評論,甚至是直接訂位、訂票;另外其适地性(location based)服務的能力也相當強悍,能夠依據用戶默認的居家地址或是所在位置來判斷、過濾搜尋的結果。

不過其最大的特色,則是人機的互動方面,不僅有十分生動的對話接口,其針對用戶詢問所給予的回答,也不至于答非所問,有時候更是讓人有種心有靈犀的驚喜,例如使用者如果在說出、輸入的内容包括了『喝了點』、『家』這些字(甚至不需要符合語法,相當人性化...),Siri 則會判斷為喝醉酒、要回家,并自動建議是否要幫忙叫出租車。

Siri 和系統的整合更加緊密

Siri 在并購前的版本整合了大量網絡服務的 APIs 。比如 OpenTable,Tickets,Taxi Magic 等等。

而 Siri 被蘋果收購了之後, 他已經被整合為系統的一部分了。

在 iOS 5的 Siri 視頻中,出現新短消息之後,交互由 Siri 發起。說明他已經常駐系統後台并且可以接管重要的系統功能了。(除了短消息還有天氣,時鐘,Maps 等等)

Siri 支持的語言

截至IOS6.1,Siri支持中文(普通話 - 中國),中文(粵語 - 中國香港),德文(德國),德文(瑞士),意大利文(意大利),意大利文(瑞士),日文,法文(加拿大),法文(法國),法文(瑞士)英文(澳大利亞),英文(美國),英文(英國),英文(澳大利亞),西班牙文(墨西哥),西班牙文(美國),西班牙文(西班牙)和韓文。

中性語音

2022年,蘋果公司在推出的最新版本iOS操作系統中加入了一種新的Siri聲音,該“聲音”在蘋果的官方解釋中被标注為:既不來自男性也不來自女性,開始為Siri提供中性語音的選項。

使用技術

概況介紹

Siri所用到的技術,很多人會回答,人工智能以及雲計算,的确,總體來說,是這兩樣技術,不過,這種概述感覺幾乎沒有任何意義,何不直接說“計算技術”(注意,不是計算機技術)呢。因此,在本文,我将介紹下我了解 Siri 可能采用的技術(由于有個人猜測,不一定準确)。

前端方面

在前端方面,即面向用戶,和用戶交互(User Interface,UI)的技術,主要是語音識别以及語音合成技術。語音識别技術是把用戶的口語轉化成文字,其中需要強大的語音知識庫,因此需要用到所謂的“雲計算”技術。而語音合成則是把返回的文字結果轉化成語音輸出,這個技術理論上本地就能完成,但不知道Siri是否如此,當然,在雲端完成也并無不可,在當前無線帶寬下,那點語音流量根本不算什麼。

後台技術

後台技術,這些其實才是真正的大角色。這些技術的目的就是處理用戶的請求,并返回最匹配的結果,這些請求類型很多,千奇百怪,要處理好并不簡單。基本的結構猜測可能是分析用戶的輸入(已經通過語音轉化),根據輸入類型,分别采用合适的技術(合适的技術後台)進行處理。這些合适的後台技術包括,①以Google 為代表的網頁搜索技術;②以Wolfram Alpha為代表的知識搜索技術(或者知識計算技術);③以Wikipedia 為代表的知識庫(和 Wolfram Alpha 不同的是,這些知識來自人類的手工編輯)技術(包括其他百科,如電影百科等);④以Yelp 為代表的問答以及推薦技術。

網頁搜索

大家天天用的Google就是這個技術的代表,而國内則以百度為代表。

知識計算

(搜索)技術(Computational Knowledge)

這個技術的代表是WolframAlpha。

不同于搜索互聯網信息,Wolfram|Alpha将從公衆的(包括公開的網頁等)和獲得授權的資源中,發掘、建立起一個異常龐大的經過組織的數據庫,再利用高級的自然語言算法進行處理,最終構造出一個類似于谷歌搜索的工具。

和網頁搜索技術不同的是,在這個系統中,得到的答案結構化程度很高,比如搜索China,能得到和中國相關的各種參數以及資料,并以接近表格的方式呈現。Wolfram|Alpha也能理解部分自然語言,比如輸出How old are you,其會回答Wolfram|Alpha的年齡。想測試這項技術的請移步Wolfram|Alpha。

這個技術國内做的應該有,但還沒有産品,也許百度的框計算算是半個。所以機會大大的有。

知識庫技術

相比于網頁搜索技術,基本以一個詞條或者主題為單位,因此得到的數據價值高,知識量大,并且結構化程度好。相比于知識計算技術,這些技術需要人的參與,這有利也有弊,利就是,畢竟暫時人比機器聰明,編輯出來的知識更豐富,準确;弊就是,人力有限,即使像維基那樣,發動社區的力量,也不能産生足夠的知識,而知識計算,理論上,隻需要算法夠,是可以産生“無限”的知識的。

問答推薦技術

其實這不能稱為一個技術,應該屬于知識庫的技術。不同的是,這個技術針對的是一些生活信息,這些信息的地域化程度很高,典型代表為Yelp。由于這東西比較簡單,就不仔細介紹了。

語言模型技術

這是如何提升Siri識别企業和餐廳等本地興趣點名稱的方法,融合了用戶所在地的知識,也就是所謂的Geo-LM,借此提升Siri的語音識别能力。這些模型讓Siri可以更好地評估用戶的發音内容。

軟件應用

在iPhone 4S的蘋果發布會中蘋果稱 Siri Voice

Assistant 将會成為 iOS 的一部分。Siri 原是一個第三方應用,是蘋果花費2億美元購買所得的。雖然在收購後很長的一段時間裡我們仍能在 App Store 上看到這一應用的身影,不過它将近有一年多的時間沒有更新。而直到蘋果在發布會上介紹Siri這一功能後,Siri 這一應用才正式下架。

大家可能沒有注意到的是,Siri 下架是精心安排的:Siri 在蘋果大會上第一次被提及的時候,這一應用還能在 App Store 上輕松的找到。但在大會結束後,這一應用就再也找不着了。看起來Siri這一應用是在大會結束的同時下架的。

為什麼要下架呢?這可能是因為蘋果擔心第三方應用若能夠實現 iPhone 4S 的功能的話,會影響現有的 iPhone 用戶購買新 iPhone 的欲望,從而影響銷量。

Siri 支持英文、法文和德文的語音識别,其中英文部分隻支持美國、英國和澳大利亞的口音,對于其他國家和地區的英語口音在識别上還存在困難。

此外,被蘋果定義為仍處在“測試階段”的 Siri 支持在美國進行地圖和本地搜索,不過蘋果官網的 Siri FAQ 頁面也承諾,相關功能在2012年将拓展到其他國家。

蘋果公司搭載在 iOS6 上的 Siri,新的 Siri 支持語言包括日語、意大利語、中國漢語、中國台灣地區、中國香港地區等地區語言,你可以用 Siri 查看當前的球賽信息,足球,籃球,排球等。包括比分和球員信息等;用它搜索最新的電影資訊,和附近的電影院;Siri 甚至可以幫你尋找餐館美食,價格,位置,甚至有評星功能。

北京時間2012年9月20日淩晨,蘋果在iPod、iPhone和iPad設備上正式放出iOS6操作系統更新。據更新信息顯示,該升級包将有超過200項新功能,其中内置了全新的蘋果地圖。在此次更新中,Siri也将支持中文。

2013年6月10日,蘋果在iPod、iPhone和iPad設備上正式放出iOS7操作系統更新。其中在Siri方面去除了“測試版”字樣。

十一功用

1.Siri 可以創建、修改、删除鬧鐘

這應該是用戶最容易想到的Siri的“正經”用法了。按住“Home”鍵,告訴Siri,“早上7點15的時候叫醒我”;想打會兒小盹,就說“40分鐘後叫醒我”。隻要準确地報上時間,Siri将是最好用的鬧鐘。

2.用 Siri 尋找咖啡廳

喝咖啡是很多上班族的習慣,一杯咖啡能夠迅速地将人調整成工作狀态。出門在外的時候,想找個咖啡廳?利用Siri就可以搞定這一切。告訴 Siri,尋找離當前位置最近的咖啡廳即可。如果你沒有附加更多的要求,Siri将反饋給還算不錯的答案,很可能是告訴你最近的星巴克在哪。如果星巴克還不能滿足你的要求,還是用更專業的應用Help吧,它會給你更詳細的答案。

3.想去哪,Siri 告訴你

查找出行路線的過程中往往要輸入不少文字。想省事的話,還是用Siri完成這一切吧。報上要去的地點,Siri會調用 Google 地圖來尋找出行路線的方案。從測試過的這種用法的用戶的反饋上看,Siri還沒有出過什麼差錯,就像GPS那樣好使。2016年9月14日,蘋果iOS 10正式版問世,易到是iOS10中首個支持Siri語音叫車的軟件。Siri可以直接啟動易到,并幫用戶完成訂車。4.用 Siri 播放随機音樂

如果你厭倦了固定順序的音樂播放列表,可以試着用Siri播放随機音樂。首先,你需要将喜歡的音樂導入到一個名為“最愛”的播放列表中。開始聽音樂的時候,告訴Siri”放皇後樂隊的歌曲”。緊接着,Siri就會在“最愛”列表中匹配皇後樂隊的歌曲并将其播放。這樣就實現了随機播放音樂的功能。

5.發送短信,Siri 代勞

還在邊走路邊發短信?行路不安全不說,發短信還費勁,以後用Siri代勞吧。走路的時候,将iPhone放在耳邊,告訴Siri“用短信告訴她,我将晚點到家”。不用匆忙,告訴Siri你想表達的内容,即可輕輕松松地發送短信。

6.天氣預報,Siri 知道

這也是Siri十分擅長的一項功能。關于氣象信息的問題,Siri都能正确理解。想要知道明天的天氣怎樣,問問Siri就知道了。

7.用Siri提醒日程安排

既然能把Siri當鬧鐘用,你當然可以用它來提醒日程安排。很多人都有使用Google日曆的習慣,用Google日曆安排自己的各項日程。生活中的一些需要提醒的小事,完全沒有必要一項項地加到Google日曆中去,用Siri就可以搞定這個問題。比如說,“十點鐘的時候,提醒我去刷牙”。

8.用 Siri 提醒地點

Siri 提醒地點的功能還不是很完善。除了“家”或“上班處”,Siri 對于一些位置稱呼的理解能力不佳。但是,Siri 對“這裡”的理解十分準确,即當前的GPS坐标位置。所以你可以這樣用 Siri 的提醒功能,途經一家不錯的小店時,可以将它的位置标記為“這裡”并設置好提醒,以便日後有時間時再次光顧。

9.Siri 為你答疑解惑

珠穆朗瑪峰多高?美國的GDP是多少?回答不上來的話,無需 Google,張嘴問問 Siri 吧。Siri 本身是不知道這些問題的答案的,它會從“知識問答引擎”Wolfram Alpha中尋找答案。所有的回答都會以自然語言的形式呈現。這也是 Siri 被認為将對 Google 重要威脅的原因。當然,Siri 在相當長的一段時間肯定不能取代Google,但對 Google 的威脅将是長遠的。當 Siri 足夠智能的時候,人們用它取代 Google 并不是沒有可能。

10.用 Siri 發送微博(支持新浪微博、騰訊微博)

不過在使用 Siri 發微博前,還得做一些必要的設置。

11.用 Siri來訂電影票。(美國)

iOS 9 中的 Siri 擁有新外觀、新聲音和新功能。它的界面經過重新設計,以淡入視圖浮現于任意屏幕畫面的最上層。Siri 回答問題的速度更快,還能查詢更多信息源,如百度百科。它可以承擔更多任務,如回電話、播放語音郵件、調節屏幕亮度,以及更多

專利侵權

2012年7月3日,上海某法院确認,已經收到上海智臻網絡科技有限公司(下稱“智臻網絡”)的訴狀,被告正是蘋果電腦貿易(上海)有限公司和美國的蘋果公司。

智臻網絡認為蘋果公司iPhone 4S中的Siri侵犯了其發明專利權。本報記者通過中國國家知識産權局的專利檢索看到,這個名為“一種聊天機器人系統”的專利,申請日為2004年8月13日,公告日為2006年2月15日。

在該專利的公開說明中,注明專利權人為上海赢思軟件技術有限公司和袁輝,後者也是智臻網絡的法定代表人。他們都與一個使用MSN工具的人熟悉的應用“小i機器人”有關,在該公司網站上,袁輝被稱為“中國網絡機器人之父”、小i機器人董事長。此外,小i機器人的産品合作商,還包括聯想智能電視、中國移動、京東商城及上海人力資源和社會保障局等公司、部門。

反壟斷調查聽證會後,蘋果公司又因一起百億元訴訟被推上風口浪尖。8月3日,小i機器人宣布正式向上海市高級人民法院提起訴訟,要求蘋果公司停止Siri專利侵權,并暫計索賠100億元。蘋果方面回應并未侵權。

流量需求

蘋果的iPhone 4S, iPhone 5,iPad3,iPad4,iPad mini1,iPod touch 5都帶有一個智能的語音助手 Siri。已經能夠完成類似網頁搜索、接打電話、設置提醒事件、發送短信和郵件等任務。

但是有一個很大的問題,就是 Siri 需要網絡才能工作。Siri 接收到用戶的命令之後會把語音傳給蘋果的服務器,經過處理後服務器将結果傳回用戶的手機,Siri 便會給出相應的回答或執行相應的動作。但是有些任務壓根用不着網絡連接(建立一個提醒事項),要是網絡連接狀況不好甚至沒有 Wi-Fi時就很讓人頭痛了。更進一步考慮,有些用戶認為使用 Siri 還有個更大的弊端:如果你敞開用,月底數據流量費用可能會讓你吓一跳。流量費用并不便宜,這個問題确實會越來越突出。不過,Siri 消耗的流量可能真的會“吓你一跳”呢。

在進行 11 種不同的測試時仔細觀察了數據量,分别有本地設備上的任務和需要上網查詢的任務。我們還進行了 4 次聽寫測試。當然了,每位用戶具體的流量數值是完全基于如何使用 Siri 以及使用頻度的。以下是的測試結果。

執行任務

我們執行了 6 項應該屬于本地的任務。其中包括:“設定一個 3 小時候之後的鬧鐘,”“設置一個周五下午 2 點的約見,”(之後讓 Siri 取消了這項任務)“我到家後提醒我總結開支報告,”以及“Ars Technica 的聯系人信息是什麼?”

這些任務執行後的數據流量是 220 KB,平均每個任務消耗 36.7 KB。實際上,流量最低的任務用掉了 18 KB,最多的 60 KB。我們認為這和執行任務所用的句子複雜程度以及何種語言有關。

另外五個任務是需要上網查詢的,有些可以直接從 Wolfram Alpha 獲取結果,有些會提示我們是否要用我們告訴 Siri 的關鍵詞在浏覽器進行搜索。比如我們問了“一個松餅裡有多少卡路裡?”“Kevin Bacon 一共演了多少部電影?”(這一條要進行 Google 搜索,我們說了 yes)以及“Lady Gaga 的真實姓名是什麼?”等問題。

這五個任務的數據流量消耗是 473.5 KB,平均每個任務 94.72 KB。具體流量從 23 KB 到 187 KB 不等,這随問題本身的情況而定。

統計一下,我們的這 11 個任務總共用掉 693.6 KB 數據流量,平均每個任務 63 KB。從上文你可以看到,本地的 Siri 任務消耗的流量明顯更少,這是符合邏輯的。

除了這 11 個任務之外,我們還用 Siri 進行了 4 次聽寫:兩個簡短的電子郵件(一封有 15 詞,另一封大概 40 詞),和兩條短信(每條大約 6-10 個詞)。短信聽寫用掉的流量分别為 12 KB 和 18 KB,平均每條 15 KB。電子郵件的分别為 36 KB 和 109 KB,平均每條 72.5 KB。很明顯,消息長度越長,所耗流量就越多,這完全取決于你的措辭。

結果

如果你使用iPhone4S,通過手機數據流量(比如 3G 網絡)讓 Siri 每天都執行一遍這 11 項任務,那麼 30 天後消耗的流量大約為 20 MB。但每個用戶肯定會問不同的問題,并且使用頻度也會大不一樣。

根據調查(包括身邊的同事、以及在 Twitter上開展的調查),大概可以把不同用戶的使用頻度分為三類:每天 1-3 次的,每天 4-6 次的,和每天 10-15 次的。也有用戶說自己每天使用的次數超過 20 次,但這種情況是極少數的。從我個人角度來講,看到這麼大的數字頗有些驚訝,我自己每天使用的次數不過 2-3 次,不過我的同事 Ken Fisher 說他每天會使用大約 15 次。

這些數字實在不容易看出什麼。而且我們之前說過,你的用量完全取決于你的措辭、你要求執行的任務種類以及你的使用頻度。這些統計數字就僅作參考吧,它們隻能顯示出一個大緻範圍。

如果你每天使用 2-3 次 Siri,每次用掉 63 KB 流量,那麼每天的用量将達到 126 KB 到 189 KB,所以每月流量消耗為 3.7 MB 到 5.5 MB。對于每天使用 4-6 次的用戶來說,每天的流量會達到 252 KB 到 378 KB,每個月要用掉 7.4 MB 到 11 MB 左右。如果你一天使用 10-15 次,每天的流量将是 630 KB 到 945 KB,每個月要消耗 18.5 MB 到 27.7 MB 的數據流量。

正如我們一再強調的,由于使用頻度的不同等幾大主要因素,每個用戶所産生的實際流量也不盡相同。這些數值就是我們測試的結果,可以作為自己選定數據套餐時的參考。

蘋果針對Verizon版本的iPhone 5發布了運營商升級包,以解決出現的無線問題。

産品争議

涉黃

2012年10月,有網友稱蘋果iPhone手機的語音對話軟件Siri可以提供“三陪”場所信息,這一說法引發輿論熱議。調查發現,蘋果提供的部分場所确有“涉黃”嫌疑。蘋果公司回應稱,Siri不能進行關鍵詞屏蔽設置,但專家指出,蘋果具有對敏感詞進行特殊處理的設計,隻是并未将上述内容列入屏蔽名單。

到2012年10月28日,Siri不會再搜索“嫖娼”的場所了!蘋果公司客服人員表示,已經将“三陪”信息列入屏蔽範圍。

Siri不再提供“三陪”場所的信息。對此,蘋果公司客服人員稱,根據用戶的反映,也将“三陪”信息列入屏蔽範圍;屏蔽範圍除“三陪”等涉黃信息外,還包括涉及暴力等違反中國法律的信息。考慮到這種信息為性交易提供便利,可能會危害社會秩序。而且,由于用戶衆多,潛在危害面也較大,蘋果公司必須及時做出糾正,且職能部門可以出面進行監管。根據現有法律,互聯網信息服務提供商不得登載和傳播淫穢、色情等中華人民共和國法律、法規禁止的不良信息内容。但是Siri提供“三陪”場所信息,并不像淫穢圖片和視頻等直接對未成年人身心造成傷害,因此夠不上違法。

然而,根據《互聯網站禁止傳播淫穢色情等不良信息自律規範》,互聯網信息服務提供商不得開設或變相開設為不道德性行為和性交易提供便利的頻道或專欄。若違反該自律規範的,應及時糾正違規行為;經勸說、警告無效的,中國互聯網協會互聯網新聞信息服務工作委員會有義務向政府有關部門建議,取消其提供相關信息服務的資質。

監管部門可要求蘋果公司對已銷售和将要銷售的手機産品統一“打補丁”,屏蔽潛在的危害社會秩序的内容。

如果Siri提到的場所不是涉黃場所,蘋果公司也可能要冒被這些場所民事訴訟、索賠的風險。

洩密

2019年8月28日,蘋果公司正式在其官網上緻歉稱,“我們知道客戶近期一直為蘋果人工審查Siri錄音感到困擾,這是我們提高Siri使用質量的一部分,我們稱之為‘評級’。當我們得知了用戶的擔憂之後,立即停止了所有人工對Siri的‘評級’的項目,并對所有的環節和政策進行了一個全面的評估。我們決定對Siri做一些改變。”蘋果公司在其官網的博文中承諾,将減少從Siri語音記錄中搜集到的用戶數據,也不會将存儲在服務器中的數據,作為銷售用途。

相關事件

2020年8月,國内人工智能技術公司小i機器人正式向上海市高級人民法院提起訴訟,要求蘋果公司停止Siri(智能助理)專利侵權,并暫計索賠金額100億元。

語音搜索

2022年2月8日,抖音搜索與蘋果 Siri 達成合作,iPhone 用戶可以通過 Siri 語音指令直接搜索抖音的視頻内容。

相關詞條

相關搜索

其它詞條