課業上的實作,導致對於XBOX kinect興趣,簡單調查一下擷取自網路的資訊
他的正式名稱是 Microsoft Kinect for Xbox 360
Kinect 靠視覺影像和紅外線直接辨識整個人的形狀, 來判斷你的位置、動作, 甚至你是誰和你的性別
,所謂身體就是控制器。
Kinect 的運作原理
Kinect 一次可擷取三種東西,分別是彩色影像、3D 深度影像、以及聲音訊號。
首先是Kinect 機身上有3 顆鏡頭,
中間的鏡頭是一般常見的RGB 彩色攝影機,
左右兩邊鏡頭則分別為紅外線發射器和紅外線CMOS 攝影機所構成的3D 深度感應器,
Kinect 主要就是靠3D 深度感應器偵測玩家的動作。
中間視訊鏡頭則是用來辨識玩家身分(靠著人臉辨識和身體特徵)、以及辨識基本的臉部表情,
此外也能應用在擴增實境遊戲、以及視訊通話時;
同時Kinect 還搭配了追焦技術,底座馬達會隨著對焦物體移動跟著轉動。
都用上了不用遙控器的體感裝置,哪裡還要玩家頭上掛個耳麥的道理,因此Kinect 也內建了麥克
風系統,用的還是陣列式麥克風。它的好處是藉由多組麥克風同時收音,比對後消除掉雜音,等
於提供了降噪功能,讓玩家的聲音能更清楚的傳遞出去。
Kinect 到底怎麼偵測3D 影像?
關於Kinect 所使用的辨識技術,網路上有許多以訛傳訛的說法。例如用兩顆攝影鏡頭拍攝成3D
影像、並以紅外線探測Z 軸深度做感應;也有許多人以為Kinect 是利用紅外線紀錄體溫的方式,
來找出人體的影像,這些當然都不是正確答案。
微軟在去年(2009 年)初收購了一家以色列籍的3DV Systems 公司(來源:reuters),包含公司
員工以及所有專利技術都歸微軟所有。該公司擁有名為ZCam 的動作感測系統,採用TOF(Time
of Flight)技術,讓許多人認為Project Natal 誕生計畫(Kinect 前身)就是採用TOF 技術,但......
最後證實大家還是猜錯了。
這裡簡單介紹一下TOF 技術,大家應該可以從字面猜到含意,Time of Flight 就是去計算光線飛
行的時間。首先讓裝置發出脈衝光,並且在發射處接收目標物的反射光,藉由測量時間差算出目
標物的距離;ZCam 就是使用TOF 技術,使用紅外線以及Accelerometers 加速度計感應器,感測
立體空間的相對位置變化,建構灰階距離影像的深度感應器。3DV Systems 公司研發該技術已經
長達10 年,並取得許多專利技術,所以受到了微軟的矚目。
不過就在今年(2010 年)年初時,微軟的開發人員卻大爆Project Natal 誕生計畫並不是如外界
傳言採用3DV Systems 公司的TOF 技術(來源:engadget)。微軟先進技術研究院副總裁Moshe
Lichtman,於去年接受媒體訪問時,就表示併購3DV Systems 公司目的不在於使用他們的技術,
而是作為保障自家感測技術的後盾。因為專利技術認定上有時較為模糊,稍有不慎就會被對手告
侵犯專利權;3DV Systems 擁有許多相關專利,因此藉由併購3DV Systems 快速取得專利,也能
避免被其他對手併購,阻撓微軟的產品研發。
另一關鍵:骨架追蹤系統
了解Kinect 如何獲得影像後,接下來就是進行辨識的工作。透過Light Coding 技術所獲得的只是
基本的影像資料,重點還是要辨識影像,轉換為動作指令。據說Prime Sense 公司並沒有提供辨
識技術,所以辨識部份得靠微軟自己搞定。
微軟會將偵測到的3D 深度圖像,轉換到骨架追蹤系統。該系統最多可同時偵測到6 個人,包含
同時辨識2 個人的動作;每個人共可記錄20 組細節,包含軀幹、四肢以及手指等都是追蹤的範
圍,達成全身體感操作。
為了看懂使用者的動作,微軟也用上機器學習技術(machine learning),
建立出龐大的圖像資料庫,形成智慧辨識能力,盡可能理解使用者的肢體動作所代表的涵義。
Kinect 偵測的最佳距離為1.2 公尺到3.5 公尺間,水平視野則是57 度,偵測範圍似乎比原本想像
的還要小,看來還是不能站的太隨意;Kinec 也配備了追焦系統,如果玩家超出影像範圍,底座
馬達可驅動Kinect 左右旋轉27 度。整體看來Kinect 對操作空間的限制,似乎比其他體感裝置更
嚴格些。
延遲讓Kinect 不精準?
由於Kinect 攝影機的影像更新頻率為30FPS,代表動作傳遞將會有33ms(1/30 秒)的延遲,Crunc
hGear 也在文中質疑這會不會造成動作偵測上的延遲,為何不使用60FPS 以上的錄影規格拍攝?
這其實是PrimeSense 公司提供的處理晶片能耐,它就只能處理VGA 畫質、30FPS 的影像。
30FPS 影像更新頻率造成的延遲應該有限,因為人類對事物的反應速度幾乎都超過100ms,已經
大於30FPS 所帶來的33ms 延遲,所以該怪的應該是你的反應太慢吧。比起偵測延遲,更該擔心
的是辨識需要的時間、以及辨識的精準度。由於Kinect 是透過辨識圖像再轉化為指令的方式,大
量的影像處理、以及事後的辨識動作,恐怕才是讓Kinect 使用者感受到延遲的原因。聽說支援K
inect 的遊戲都有針對延遲做最佳化,盡可能讓使用者減少延遲的感受。
另外一點備受質疑的,就是在精準度方面的問題,國外調查Kinect 的判斷精準度為4mm,的確
是輸給了PlayStation Move 的1mm。但論精準度,可能每種體感裝置都還比不上實體搖桿。但K
inect 帶來的全身體感優勢,所能做的事情鐵定比PlayStation Move 和Wii 多更多,例如Ubisoft
推出的健身遊戲《Your Shape Fitness Evolved》,類似Wii 平台上的《Wii Fit》,但是透過骨架追
蹤系統來玩瑜珈、武術等遊戲時,對姿勢的要求絕對高於Wii Remote+Wii Fit;舞蹈遊戲《Danc
e Central》也是相同的道理。
資料來源:
留言列表