基于隱馬爾可夫模型的動作識別的研究與實現

來源: www.bnzqvc.live 作者:vicky 發布時間:2015-07-08 18:47 論文字數:34582字
論文編號: sb2015070722505313259 論文地區:中國 論文語言:中文 論文類型:碩士畢業論文 論文價格: 150
本文是計算機論文,本文主要的研究內容是使用五狀態雙層隱馬爾科夫模型(FDH-HMM)對人體動作進行識別。通過研究人體動作特征與 HMM 模型設計的關系,本文的方法減少了目前算法中的很多不
第 1章  緒論

人體動作識別的基本任務是通過提取能夠充分表達運動序列圖像信息的特征,運用一定的方法來判斷人的動作范疇,最終為行為理解奠定基礎,其具有廣泛的實用價值。近些年來,該問題引起了學術界、科研機構、安全機構等機構研究者的廣泛關注,逐漸成為計算機視覺熱點研究方向之一,正在為人們的生活帶來全新的變革。

1.1 論文的研究背景及意義
如今在人們的日常生活中,對計算機的需要越來越強,而且產生了各種各樣數量巨大的數據需求,如何對這些數據進行區分處理已經是擺在我們面前的一個棘手問題。其中視頻和照片的信息量巨大,并且是一種可以直接拍攝獲取、信息量豐富的一種信息媒介,我們應該通過怎樣的手段讓計算機像我們人類一樣,可以感知甚至是主動判斷外界的信息,對我們人類提供有用的幫助,已經成為當下最熱點的課題。
由于火車站、飛機場等公共場所安全需要逐步提升,視頻監控系統的需求量也不斷增長,而且識別細致的需求程度也不斷提高,因此對智能監控系統中的運動物體動作識別已經成為該領域最有價值的研究方向之一。
動作識別主要是分析視頻圖像,處理其中的動作序列,讓計算機理解圖像的動作,最終的目的就是可以讓其對圖像中的目標進行檢測、跟蹤、識別動作。我們可以很容易分辨出一段視頻中的動作類型,更可能推測出接下來的動作,但是這種分辨能力和預判對于計算機來說卻是一項挑戰。人類就此問題展開了大量研究,可是因為很多不利因素的掣肘,使得目前這項技術的發展并沒有預想的迅速。從如今研究情況來看,關于動作識別的技術只能在人們預先設定的背景環境或者是一些不利因素影響較小的背景下提取人體輪廓,從中得到我們感興趣的信息與特征,最后利用一定的方法進行最后的動作識別。根據時下新技術的發展,很多新興技術和產品已經應用到生活中,主要包括:
(1)智能視頻監控:這是一個對我們最為重要的技術,目前很難看到在我們經常去的公眾場地會有不存在監控設備的地方,所以說其需求是非常的廣泛,通過安裝攝像機獲取周圍環境中的視頻數據,利用計算機視覺的原理實現對環境中人體的動作捕獲,然后對獲取的數據進行分析,從而達到二十四小時實時監控的目的,以此來捕獲異常的行為并采取相應措施。這樣既能夠及時的阻止悲劇的發生,而且能夠節省大量的人力和物力。


1.2 國內外研究現狀
近年來,國內外學者也都在動作識別領域中積極參加研究。在國際上,Carnegie Mellon 大學、Massachusetts 學院等高校對 VSAM(Visual Sveillanee And Monitoring)工程做出了巨大的貢獻。其主要工作是對自動視頻理解技術進行研究,目前應用在戰場和普遍民間場景中。IBM 與 Microsoft 等公司在商業領域中展開競爭,將很多計算機視覺的產品投入市場,目前基于視覺的手勢識別接口運用廣泛,比較受到認可。在 2013年,Jacinto 等人利用了更為先進的矢量場技術,對于識別人數較多的人群的動作有了不錯的效果。
在國內,眾多大學與科研機構如北京大學,中科院研究所參與了這一課題的研究,雖然接觸時間較國外晚,但也做了許多關鍵與深入的研究。中科院的模式識別國家重點實驗室NLPR(National Laboratory of Pattern Recognition)視覺研究小組,從1987 年成立至今,在國內計算機模式識別地域處于領先地位,收獲了豐碩的科研成果。
1.2.1 特征提取研究現狀
目前基于動作識別的研究主要有四個不同方面的特征應用,本文主要介紹最為流行且效果很好的兩類特征:靜態特征、動態特征,以及兩者的組合。
靜態特征主要是指在動作識別中,利用人體尺寸、顏色、邊緣輪廓、姿態或區域顏色等外觀形狀來描述人體動作靜態姿勢,然后將靜態姿態序列進行動作識別的描述。其中,姿態矩特征因為可以描述人體細節特征而被廣泛應用。在我們的周圍的很多學者中,研究了許多利用該特征進行識別可能,有的用到了形狀,有的用到了顏色,有的用到了矩等。Davis等人采用矩作為特征向量用于識別階段的模板匹配,識別率較高。但他們只到三階Hu矩,雖然計算簡單,但圖像信息沒有充分提取,并且Hu矩是非正交的,具有信息冗余性。蘇開娜等人提出了一種基于偽Zernike  矩的識別的方法,提取的矩特征具有正交性,減少了信息。Cho和Roland比較了幾何矩、Legendre矩、Zernike矩、pesudo-Zernike矩、Fourier-Mellin矩、旋轉矩以及復數矩的優缺點,從綜合考慮來講,Zernike矩是所有矩特征中最好的。雖然它能通過高階矩更全面表達圖像信息,但計算復雜,同時Zernike矩對位于單位圓區域邊沿的目標形狀很敏感。
雖然我們利用靜態特征獲取了運動圖像序列中很多重要信息,但是當場景比較復雜的時候,很多靜態信息并不容易獲得,鑒于此種情況,很多學者不在從繁瑣的人體檢測、跟蹤分割入手,而是直接提取動態特征。

第 2章  HMM原理及相關理論

隱馬爾可夫模型(Hidden Markov Models 簡稱 HMM)是一種統計學習學習的模型,最適合用來做標注的問題,其講述了隱馬爾科夫兩條隨機鏈中的那個隱藏的鏈條所隨機生成的觀察值順序流程的過程,屬于生成式分布,是一種我們需要的模型。首先引出模型,接下來介紹模型的定義和數學背景知識,然后對于隱馬爾科夫的三個問題,突出三個解決方案。最后詳細敘述隱馬爾科夫模型不同角度的分類。

2.1 HMM 的定義
隱馬爾可夫模型(Hidden Markov Model),HMM 通過表觀狀態讓我們推測接下來最可能的情況,被廣泛應用語音識別、人工智能領域。在動作識別中,此種模型也可以很好地得到應用。但是由于開始時候,大家并不熟悉該模型,所以其使用不是很廣泛。近些年來,才逐漸被利用于圖像領域。
隱馬爾科夫模型具有是由五個參數組成的,一般由五元組來表示,也可由三元組表示。五元組的時候有初始概率矩陣、狀態轉移矩陣以及觀察值概率矩陣、狀態數目、每個狀態對應的觀察值數目五個元素來確定。三元組表示時,就是去掉后兩點,由最主要的前面三個點來表示我們的這個模型。

2.2 HMM 的三個基本問題及算法
本節中,論文將會分析 HMM之中的核心問題,分別對 HMM可以解決的三個問題及其算法進行描述。
2.2.1 三個基本問題
上一節論文給出了HMM 的定義,如果要將HMM應用在動作識別中,必須解決好三個基本問題:概率計算問題、學習問題、預測問題。
混淆矩陣是 HMM 三要素之一,是影響訓練結果最重要的參數模型,根據其輸出的不同大致有三種類型,有離散型、連續型、本連續型。他們的主要區別是根據 B矩陣輸出的不同,上文描述的 HMM模型都屬于離散模型,因為 B是以矩陣形式輸出的;而當它以概率密度輸出時,就是連續型;而其隱含狀態數目超多時,半連續就可以很好地被利用了。因此,綜上所述,一般 HMM 主要分為以上三種類型,具體使用各有特點,需要對于具體地情況,進行詳細地分析,選取合適的模型。
本章對HMM 基本理論、基本原理做了分析,重點分析了隱馬爾可夫模型提出的三個問題及其相應的算法,這些算法對于將HMM應用于動作識別中非常關鍵,其中前向-后向算法可以進行識別,Baum-Welch 算法可以進行學習,也從側面說明了 HMM 是一種非常適合進行動作識別的研究的模型。

第 3章  預處理 .................... 20
3.1  基于背景減除法的人體運動目標檢測 .......................... 20
3.2  視頻圖像處理 ......................... 23
第 4章  人體動作特征提取與描述 ................. 28
4.1 引言 ........................... 28
第 5章 基于 HMM的人體動作識別 ............ 37
5.1 動作分析 .................... 37
5.2 模型及初始化 ......................... 38

第 5章 基于 HMM的人體動作識別

在本章中,我們將用五狀態 DH-HMM 進行人體動作識別,并將其與傳統模型進行對比。FDH-HMM 是一個經過優化的模型,它的優點是把人體動作特征與 HMM 布局設計結合起來,限制狀態數量和狀態轉移條件,減少模型中的參數數量,在降低運算復雜度的同時提高了人體動作識別的準確度。

5.1 動作分析
HMM  是一個雙重隨機過程的統計模型,通過表觀狀態讓我們推測接下來最可能的情況,被廣泛應用語音識別、人工智能領域。在動作識別中,此種模型也可以很好地得到應用。首先我們觀察圖 5.1,這是一個人走路的人體剪影圖。由常識可以推知,一個人走路時,其動作一定具有一定的規律性與周期性。如果將一個動作周期中的“走”分解成取若干動作,并提取出關鍵狀態,此例中將此動作分為 5個關鍵狀態。
可從圖中看出“走”的各個狀態從右至左。開始的時候,人站在原地未動,胳膊與腿保持一致;接下來,雙肘提到兩側腰部附近,同時身體前傾;第三步,微抬起左腿;第四步就是邁出左腿,同時右臂前伸;接下來右腿邁到前面,左臂前伸。直到最后停下來,回到初始狀態。因此我們選擇五個關鍵姿態代表的五狀態作為本文狀態數。

本文實驗中,關鍵因素之一為隱狀態的數量。如果隱狀態數量過多,那么特征抽取的數量會急劇增加,與其對應矩陣的維數也同樣會增大,這會直接導致維數災難。如果隱狀態數量過少,將會直接影響人體動作的識別效果。從我們對人體動作的分析來看,我們選擇的五狀態符合一般人體運動的規律。

結論

計算機視覺的發展日新月異,人類的目標是要讓計算機可以像人類一樣分辨動作,甚至預測下一步動作。從目前的發展來看,動作識別雖有一定發展,但遠未達到理想的目標。如今動作識別領域的研究大部分仍停留在一些簡單動作、簡單背景階段,要想實現對復雜環境下的復雜動作準確識別,最終實現機器人工智能化,還需提出并嘗試更多更先進的識別模型和算法。本文選擇了 FDH-HMM 進行動作識別作為解決上述問題的突破口進行研究。
全文的主要工作及結論總結如下:
1.在閱讀大量文獻的基礎上,研究分析了國內外人體動作識別領域已有的方法和研究成果,其中重點學習了特征提取和 HMM 識別的方法。
2.在圖像預處理方面,對視頻圖像中人體動作識別的前期技術做了細致的研究和實驗。采用背景減除方法得到人體行為的側影圖,然后進行形態學處理,改善圖像的質量,獲得滿意的人體運動圖像。最后,利用基于 Kalman濾波的Camshift 算法實現人體跟蹤。
3.在特征提取方面,深入研究了特征提取的相關知識,詳細介紹了動態特征、靜態特征及其組合,深入分析了各自的優缺點。按照本文的實驗,采用了將改進的 Zernike矩特征與運動特征相結合的特征提取算法。
4.在動作識別方面,與本文提出的特征組合相結合,采用了五狀態的雙層 HMM 模型進行人體動作識別。最后通過對 Weizmann 和 KTH 數據集實驗結果的分析與比較,突出本文方法的優勢。
參考文獻(略)

原文地址:http://www.bnzqvc.live/jsjlw/13259.html,如有轉載請標明出處,謝謝。

您可能在尋找計算機論文方面的范文,您可以移步到計算機論文頻道(http://www.bnzqvc.live/jsjlw/)查找


上一篇:基于網絡編碼和鏈路相關性的多包洪泛協議
下一篇:圖像分割的活動輪廓模型研究
彩票6加1怎么玩 知道合伙人赚钱吗行家还是团队好 彩客网安卓 现在开出租车的赚钱吗 平版电脑单机捕鱼游戏 福州麻将单机版 3人篮球比分 短拆业务赚钱吗 北单 佳宝牛奶代理赚钱吗 金满贯彩票苹果 2012雪缘园比分 网络捕鱼的人现在都怎么样了 免费湖南麻将 老公赚钱自己拿着怎么办 2012中甲足球比分 篮球比分网即时比分90