歡迎來到優(yōu)發(fā)表網(wǎng)!

購物車(0)

期刊大全 雜志訂閱 SCI期刊 期刊投稿 出版社 公文范文 精品范文

視覺算法培訓(xùn)范文

時間:2024-01-01 15:42:55

序論:在您撰寫視覺算法培訓(xùn)時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。

視覺算法培訓(xùn)

第1篇

關(guān)鍵詞:高校教師教育技術(shù)培訓(xùn);決策樹ID3算法;應(yīng)用

中圖分類號:G451.2 文獻(xiàn)標(biāo)志碼:A 文章編號:1002-0845(2012)10-0098-02

信息技術(shù)的迅猛發(fā)展引起了教育的深刻變革。為此,提高教師的信息素養(yǎng)已成為推動我國高等教育信息化建設(shè)的必由之路。高教司于2000年發(fā)出的《關(guān)于開展高校教師教育技術(shù)培訓(xùn)工作的通知》(高教司【2000】79號)[1]中指出,“教育技術(shù)培訓(xùn)”是“新世紀(jì)教改工程”和“現(xiàn)代遠(yuǎn)程教育工程”的重要組成部分,是深化教學(xué)改革、提高教學(xué)質(zhì)量的重要舉措。

常熟理工學(xué)院自2001年6月開始,對教師進(jìn)行教育技術(shù)培訓(xùn),2003年1月起申報江蘇省教育技術(shù)培訓(xùn)點,次年申報成功。2007年,學(xué)校正式下發(fā)的《常熟理工學(xué)院講師等中級職稱資格條件》(常理工[2007]73號)第二章第七條規(guī)定:教師申報教學(xué)系列、思政系列的中級職稱應(yīng)參加學(xué)?,F(xiàn)代教育技術(shù)培訓(xùn)并取得合格證書。近幾年來,學(xué)校先后舉辦了十期教師教育技術(shù)中級培訓(xùn)班,共400多名中青年教師參加了培訓(xùn),極大地提高了教師的多媒體教學(xué)水平,加快了學(xué)校信息化建設(shè)的步伐。

一、高校教師教育技術(shù)培訓(xùn)存在的問題

教師教育技術(shù)培訓(xùn)的研究對象是教學(xué)過程與教學(xué)資源,研究范疇包括對教學(xué)過程的設(shè)計以及教學(xué)資源的開發(fā)、應(yīng)用、管理與評價。目前,各高校的教師教育技術(shù)培訓(xùn)工作雖已取得了一定的成績,但從培訓(xùn)的實際效果來看,仍存在著一些問題,主要表現(xiàn)在以下三個方面。

1.培訓(xùn)時間安排不夠合理

目前,教師教育培訓(xùn)基本采用集體面授的方式。由于參訓(xùn)教師自身所承擔(dān)的教學(xué)工作和科研任務(wù)比較繁重,很難抽出一段相對集中的時間來參加教育技術(shù)培訓(xùn)。為解決上述矛盾,高校通常會選擇利用寒暑假時間安排培訓(xùn),這需要犧牲培訓(xùn)教師和參訓(xùn)教師的許多休息時間,容易引發(fā)不滿情緒,嚴(yán)重影響了教師參訓(xùn)的積極性,極大地降低了培訓(xùn)效果。

2.培訓(xùn)內(nèi)容安排不科學(xué)

由于培訓(xùn)內(nèi)容是根據(jù)全校教師需求統(tǒng)一安排的,基本沒有考慮到參訓(xùn)教師自身所具備的知識層次、學(xué)科背景、思想意識等方面的差異,因此很難體現(xiàn)學(xué)科差別。各學(xué)科教師混合在一起集中學(xué)習(xí),導(dǎo)致理論知識講解過多而與教學(xué)實際聯(lián)系較少,參訓(xùn)教師難以從根本上真正掌握教育技術(shù)。

3.考核方式單一,培訓(xùn)評價體系不健全

目前,高校教師培訓(xùn)采取的考核方式往往比較單一,通常以參加理論考試或者提交相關(guān)論文、作業(yè)等作為培訓(xùn)的最終考核結(jié)果。此外,各級培訓(xùn)機構(gòu)大多未能及時地對培訓(xùn)過程做出評價,同時缺少參訓(xùn)教師的自我評價環(huán)節(jié),因而不利于教育技術(shù)培訓(xùn)工作的后續(xù)支持和進(jìn)一步開展。如此看來,建立和完善培訓(xùn)評價體系顯得尤為重要,這也是建立教師培訓(xùn)長效機制的關(guān)鍵所在。

二、分類技術(shù)與決策樹ID3 算法的相關(guān)理論

針對參訓(xùn)教師在知識層次、學(xué)科背景、思想意識等方面存在的差異,筆者提出了“先分類后培訓(xùn)”的思路。在培訓(xùn)正式開始之前,可采用數(shù)據(jù)挖掘領(lǐng)域內(nèi)的分類技術(shù)對參訓(xùn)教師進(jìn)行分類,這樣有利于激發(fā)參訓(xùn)教師的積極性,從而增強他們運用現(xiàn)代教育技術(shù)輔助教學(xué)的主動性和自覺性。

1.分類

作為數(shù)據(jù)挖掘的重要任務(wù)之一,分類[4]就是要找出一個類別的概念描述或預(yù)測未來的數(shù)據(jù)趨勢,它代表了這類數(shù)據(jù)的整體信息。分類的目的是為了構(gòu)造一個分類函數(shù)或分類模型(也稱分類器),該模型能夠把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定的類別中。

2.相關(guān)概念及定義

根據(jù)信息論中的有關(guān)定義,熵一般用于測量一個非葉節(jié)點的信息量的大小。若存在n個相同概率的消息,則每個消息的概率p是1/n,此時一個消息傳遞的信息量應(yīng)為-log2(p)=log2(n)。若給定的概率分布P=(p1, p2, … , pn),則由該分布傳遞的信息量稱為P的熵I(P)。

若一個記錄的集合T根據(jù)類別屬性的值被分成相互獨立的類C1,C2,…,Ck,則識別T的一個元素所屬哪一類所需要的信息量是INFO(T)=I(P),其中P是(C1, C2, … , Ck)的概率分布。

若先根據(jù)非類別屬性X的值將T分成集合T1,T2,…,Tn,則INFO(X, T)是在已得到X的值后確定T中一個元素的類別屬性時所需要的信息量,可通過確定Ti的加權(quán)平均值來得到,增益Gain(X,T)=INFO(T)-INFO(X, T)。

因此,可利用Gain(X, T)將屬性進(jìn)行排列,并可構(gòu)造一棵決策樹,其中每一個節(jié)點在屬性中都是具有最大增益的一個,從而不必考慮來自于根的路徑。

3.決策樹ID3算法

決策樹ID3算法[4]是由Quinlan首先提出來的。該算法是以信息論為基礎(chǔ)、以信息熵和信息增益度為衡量標(biāo)準(zhǔn)實現(xiàn)對數(shù)據(jù)的歸納分類的。給定一個非類別屬性C1,C2,…,Cn的集合、類別屬性C及記錄的訓(xùn)練集T之后,可以用ID3算法構(gòu)造一棵決策樹,其中R是一個非類別屬性集合,具體算法如下:

若T為空,返回一個值為無效的單個節(jié)點;

若T是由其他均為相同類別屬性值的記錄組成,返回一個帶有該值的單個節(jié)點;

若R為空,則返回一個單節(jié)點,其值為在T的記錄中找出的頻率最高的類別屬性值(這時將出錯,即對記錄進(jìn)行了誤分類),將R中屬性之間具有最大Gain(D, T)值的屬性賦給D;

第2篇

關(guān)鍵詞:汽車駕駛員 視覺特性 視覺-眼動系統(tǒng) 應(yīng)用

0 引言

隨著車流量的增加,大量交通信號設(shè)施等因素使駕駛員的視覺環(huán)境變得更加復(fù)雜。在這種復(fù)雜的駕駛環(huán)境中,會嚴(yán)重影響駕駛員的視覺,易于發(fā)生交通事故。因此,駕駛員需集中駕駛保持對交通環(huán)境的認(rèn)知以及理解處理后的視覺信息。擁堵的車輛和行人形成一個高度復(fù)雜的交通環(huán)境,為了行車安全,需要提供更多的視覺處理信息。

1、駕駛行為的視覺特性研究

視覺在“人-車-路”系統(tǒng)中起著關(guān)鍵性作用并在很大程度上影響著駕駛員的決定。對駕駛行為進(jìn)行分析及基于實時視覺分析被稱為EAP系統(tǒng)進(jìn)行研究。此系統(tǒng)針對駕駛員行為進(jìn)行分析并收集同步實用的可嵌入信息,如眼動方向、軌跡跟蹤等。

在此框架中,提出了一個便于分析聚焦面積的司機駕駛情況,憑借區(qū)域和興趣進(jìn)行自動檢測的新方法。目的是跟蹤工作自動存儲的視頻區(qū)域(ROI)。這里主要研究基于一個最新研發(fā)實時可視化分析工具叫Eye Access Pilot(EAP)系統(tǒng)。這是一種新一代眼動跟蹤分析且不受駕駛員干擾的EAP視覺系統(tǒng)。它是基于圖像處理和數(shù)值算法的實時系統(tǒng),目的是來確定駕駛員眼角度。為了設(shè)計一個能顯示駕駛員行為的預(yù)測模型,眼動與駕駛員的行為相關(guān)性非常重要,能夠?qū)崿F(xiàn)對駕駛員準(zhǔn)確變更車道。EAP視覺系統(tǒng)使用圖像處理技術(shù),尤其是應(yīng)用數(shù)值算法來確定在多種實際駕駛條件下的駕駛員眼睛方位。

用于單眼視覺場景自動感興趣區(qū)域跟蹤已付諸實施。采用固定在駕駛艙的模型具有一定的穩(wěn)定型,這些模式并不干擾駕駛員行為。應(yīng)用更具識別能力的模式以增強精確度的研究正在研究中。通過相關(guān)和定性不同駕駛員視覺行為的研究,結(jié)果通過EAP視覺系統(tǒng)獲得 ,尤其是自動ROI跟蹤,可量化參數(shù)如軌道與視知覺,被認(rèn)為是認(rèn)知模型的主要輸入。

2、視覺-眼動系統(tǒng)在交通方面的應(yīng)用

2.1 使交通信息傳遞更準(zhǔn)確

一些學(xué)者測量了交通標(biāo)志在不同速度下的可視性和駕駛員的識別能力,還有人則測試了交通標(biāo)志的燈光亮度對用戶和駕駛員反應(yīng)時間的影響。目前對交通標(biāo)志的研究大多還局限在對標(biāo)志外觀尺寸、顏色搭配及設(shè)施結(jié)構(gòu)等方面,較少有從駕駛員在駕駛過程中自身特征如眼部運動特征的角度來研究。因此我們注重從駕駛員的角度出發(fā),研究駕駛員在行車過程中的眼部運動特征和視認(rèn)特性以及兩者間的聯(lián)系,完善交通標(biāo)志的設(shè)計設(shè)置,更好地發(fā)揮交通標(biāo)志的作用。

2.2 修正道路口通行能力

目前通常以飽和度法計算交叉口的通行能力,涉及到的飽和流率模型將道路要素,交通要素,周邊要素作為其主要影響因素,而忽視了駕駛員因素的影響。事實上,交叉通流率處于不同水平時,駕駛員的視覺特性也會發(fā)生變化,當(dāng)交叉通流率增大時,駕駛員的視覺特性由穩(wěn)定變?yōu)椴环€(wěn)定。應(yīng)用駕駛員在交叉口不同交通流率水平下的視覺-眼動特性參數(shù),對飽和流率模能力而不是交叉口本身特性所決定的最大通行能力。只有交叉口的設(shè)計考慮了駕駛員因素找出趨于駕駛員行車安全的最大通行能力,設(shè)計方案的實施效果才能真正得到改善。

3、結(jié)語

當(dāng)前視覺-眼動系統(tǒng)在交通方面的研究還主要是使用國外的儀器設(shè)備。隨著眼動儀智能化的進(jìn)一步發(fā)展,硬件的小型化、低成本,眼動在交通方面的應(yīng)用研究將會越來越廣泛,眼動研究與對駕駛員的研究結(jié)合將會更為緊密。根據(jù)駕駛員的視覺特性,在今后的駕駛培訓(xùn)工作中應(yīng)該重視駕駛?cè)嗽谝曈X方面的特性,對目前的駕駛培訓(xùn)工作加以改進(jìn),提高駕駛?cè)艘曈X信息獲取能力,從而減少駕駛?cè)税l(fā)生交通事故的可能性,減少交通安全隱患,提高交通安全。

參考文獻(xiàn):

[1]鄧鑄.眼動心理學(xué)的理論技術(shù)及應(yīng)用研究[J].南京師大學(xué)報,社會科學(xué)版,2005,1

[2]馬勇,郭應(yīng)時.基于眼動分析的汽車駕駛員視覺搜索模式研究[D].長安大學(xué):交通運輸規(guī)劃與管理,2006,5

[3]范紅靜.駕駛員動態(tài)視覺特性及對交叉口通行能力的影響研究[D].南京:東南大學(xué),2008.

第3篇

[關(guān)鍵詞]知識轉(zhuǎn)化 可視化技術(shù) 可視化展示 可視化繪制

[分類號]G354

1 可視化技術(shù)在知識轉(zhuǎn)化中的作用

野中郁次郎提出的經(jīng)典SECI模型將知識轉(zhuǎn)化區(qū)分為四種模式:社會化(socialization)、外化(Exter-nalization)、組合(Combination)、內(nèi)化(Internalization)。在社會化模式中,利用可視化技術(shù)能夠搭建便于觀察和模仿的溝通平臺,實現(xiàn)隱性知識的分享與傳播;但由于沒有將隱性知識系統(tǒng)地表示出來,因此可視化技術(shù)對社會化模式的支撐作用并不直接。鑒于可視化技術(shù)在豐富知識的表示方式的優(yōu)勢上,筆者認(rèn)為可視化技術(shù)在知識轉(zhuǎn)化中的作用主要體現(xiàn)在外化模式、組合化模式以及內(nèi)化模式當(dāng)中。

1.1 可視化技術(shù)在外化模式中的作用

外化模式是將隱性知識系統(tǒng)整理、清晰表達(dá)出來供他人分享和利用的過程,可視化技術(shù)能夠表達(dá)文字難以表示的隱性知識。野中郁次郎曾指出:“將隱性知識轉(zhuǎn)化為顯性知識意味著尋找表達(dá)難以表達(dá)的知識的方法。完成這一任務(wù)最強有力的管理工具之一是圖形方法”。在外化模式中可以采用的可視化技術(shù)包括:概念圖、認(rèn)知地圖、思維導(dǎo)圖以及視覺隱喻。概念圖對結(jié)構(gòu)化知識具有很強的表達(dá)能力;認(rèn)知地圖能夠高效表達(dá)因果知識;頭腦風(fēng)暴過程中,利用思維導(dǎo)圖可以將參與人員的想法組織起來,不僅能夠明確討論的方向、給出結(jié)論,而且能夠誘導(dǎo)思維、激發(fā)人們創(chuàng)造知識;視覺隱喻則將知識表示為人類更易理解的事物。可視化技術(shù)在外化模式中的作用不僅體現(xiàn)在知識表示上,同時體現(xiàn)在知識評價上。根據(jù)圖形,參與人員能夠制定直觀的評價指標(biāo)和方法,快速完成知識評價。

1.2 可視化技術(shù)在組合化模式中的作用

組合化模式通過分類、重組、分析等手段將零散的顯性知識聚合在一起并從中提煉出新的顯性知識。隨著知識挖掘技術(shù)的日益成熟,組合化模式更傾向于利用知識挖掘技術(shù)來實現(xiàn),而可視化技術(shù)能夠支撐知識挖掘的完成??梢暬夹g(shù)不僅提供一定的布局算法將知識挖掘產(chǎn)生的數(shù)據(jù)、知識展示出來讓知識專家更為輕松地觀察和理解,而且還提供一定的交互機制來影響知識挖掘的過程,使得知識專家可以透過圖形化界面動態(tài)、全面地操控知識挖掘的完成。因此,可視化技術(shù)對知識挖掘的作用不僅體現(xiàn)在挖掘結(jié)果上,而且體現(xiàn)在知識挖掘的整個過程??梢暬夹g(shù)與知識挖掘相結(jié)合,能夠充分發(fā)揮挖掘算法、布局算法、交互算法各自的優(yōu)勢,從零散的顯性知識集合中發(fā)現(xiàn)不平凡的模式,提煉出新的顯性知識。

1.3 可視化技術(shù)在內(nèi)化模式中的作用

在內(nèi)化模式中,人們通過資料收集和整理、資料分析和利用、邊干邊學(xué)、在職培訓(xùn)、觀察學(xué)習(xí)、當(dāng)面交流等渠道學(xué)習(xí)顯性知識,并通過記憶、消化、吸收等思維活動將其轉(zhuǎn)化為個人的隱性知識。利用可視化技術(shù)支撐內(nèi)化模式的實現(xiàn),主要體現(xiàn)在知識導(dǎo)航和知識建構(gòu)兩個方面:一方面,可視化技術(shù)能夠提供直觀的知識導(dǎo)航工具,方便人們收集、組織和管理知識資源;另一方面,可視化技術(shù)能夠提供簡易的知識建構(gòu)工具,支撐知識建構(gòu)的完成。常見的知識導(dǎo)航工具包括領(lǐng)域本體、專業(yè)敘詞表、知識分類表、知識地圖、領(lǐng)域思維導(dǎo)圖、個人思維導(dǎo)圖、領(lǐng)域概念圖、個人概念圖、文獻(xiàn)地圖、文獻(xiàn)聚類圖、文獻(xiàn)時間分布圖、文獻(xiàn)內(nèi)容直方圖、書架隱喻、教材隱喻和報紙隱喻等。知識建構(gòu)是對外部知識資源進(jìn)行主動選擇、加工和處理,從而獲得自己理解意義的過程。

綜上,可視化技術(shù)通過豐富知識的表示方式,促進(jìn)外化模式、組合化模式以及內(nèi)化模式的完成,根據(jù)完成可視化表示的主體不同,可以將可視化技術(shù)在知識轉(zhuǎn)化中的作用區(qū)分為兩種不同機理:以人腦處理為中心的可視化繪制和以計算機處理為中心的可視化展示。

2 可視化繪制

可視化繪制是由人類借助一定的可視化技術(shù)工具將大腦中產(chǎn)生和擁有的知識以圖形化方式表示出來,以關(guān)聯(lián)人腦中的知識結(jié)構(gòu)與知識庫存儲的知識結(jié)構(gòu),旨在產(chǎn)生更多的知識以增加人腦和知識庫的知識存量。可視化繪制流程,包括知識準(zhǔn)備、知識互動以及圖形繪制三個步驟,分別形成個人知識空間、共享知識空間以及視覺對象空間。

2.1 個人知識空間

個人知識空間是單個知識工人擁有的知識構(gòu)成的知識空間,是通過長期學(xué)習(xí)、不斷積累形成的。個人知識空間不僅包括人腦中的知識,也包括個人計算機存儲的知識。在學(xué)習(xí)和工作中人們常常借助軟件工具將學(xué)習(xí)資料、工作文件保存管理起來,并將個人體會、讀書筆記、讀后感想等各種想法、觀點、思路、總結(jié)等學(xué)習(xí)成果撰寫成文檔存儲起來。這些文檔均是個人知識的體現(xiàn),反映特定人的知識結(jié)構(gòu)。人腦中產(chǎn)生和擁有的知識是可視化繪制的直接來源,但是這些知識只有通過長期積累才能獲取的。就某一次的可視化繪制而言,知識準(zhǔn)備是臨時的,形成的個人知識空間反映的是臨時的個人知識結(jié)構(gòu);但實質(zhì)上,知識準(zhǔn)備是長期的,包括個人以往所有的學(xué)習(xí)和工作總結(jié),是一個不斷積累、永元止境的過程。

2.2 共享知識空間

共享知識空間是由一群人參與討論、互相協(xié)作、相互評價、取長補短、充分利用各自優(yōu)勢、自由發(fā)揮形成的動態(tài)知識空間。共享知識空間可以是一次集體討論,可以是頭腦風(fēng)暴過程,也可以是協(xié)作學(xué)習(xí)過程。協(xié)作與對話是共享知識空間形成的關(guān)鍵。不同的人對知識的理解是不一樣的,每個人都有自己的認(rèn)知結(jié)構(gòu),只有通過協(xié)作才能達(dá)成共識,形成統(tǒng)一的知識結(jié)構(gòu)。對話是協(xié)作不可或缺的環(huán)節(jié),參與互動的人員之間需要溝通交流,只有通過對話才能保證協(xié)作的順利進(jìn)行。共享知識空間的形成是一次知識互動完成的,而且不能復(fù)制,是參與人員的即興發(fā)揮。

2.3 視覺對象空間

視覺對象空間是由一組視覺對象及其屬性組成的空間,是由人類根據(jù)共享知識空間生成的知識結(jié)構(gòu),并且利用圖形軟件繪制而成的。視覺對象空間可以是一組概念圖、一組思維導(dǎo)圖或一組語義網(wǎng)絡(luò)圖或一組認(rèn)知地圖,也可以是一幅通過視覺隱喻形成的圖形。視覺對象空間的形成由繪圖軟件協(xié)助完成,繪圖軟件的設(shè)計應(yīng)簡單易用,同時提供各類面板、記憶功能。實施繪制的人員可以是參與知識提取或知識建構(gòu)的知識工人,也可以是專門的知識工程師,還可以是善于利用繪圖軟件的計算機工程師,當(dāng)然也可以是幾個人員協(xié)作完成。

3 可視化展示

可視化展示是將抽象數(shù)據(jù)空間轉(zhuǎn)換為直觀視覺空間,以便人類利用強大視覺處理能力發(fā)現(xiàn)隱藏在抽象

數(shù)據(jù)空間中的模式和知識。可視化展示流程,包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)析取以及數(shù)據(jù)映射三個步驟,分別形成原始數(shù)據(jù)空間、可視化數(shù)據(jù)空間及視覺對象空間。

3.1 原始數(shù)據(jù)空間

原始數(shù)據(jù)空間是由需要進(jìn)行可視化展示的原始數(shù)據(jù)構(gòu)成的數(shù)據(jù)空間,是通過篩選、采集知識庫中的相關(guān)數(shù)據(jù)并進(jìn)行格式化、結(jié)構(gòu)化處理形成的。原始數(shù)據(jù)空間的形成通過自動采集實現(xiàn),關(guān)鍵技術(shù)是信息抽取和自動標(biāo)引。因為知識庫中存取的知識數(shù)量巨大、內(nèi)容豐富、格式繁雜、結(jié)構(gòu)化程度不一,包括各種格式的Web文檔、文本文檔、多媒體文檔及數(shù)據(jù)庫表格。如何對這些文檔進(jìn)行格式轉(zhuǎn)換形成結(jié)構(gòu)化的數(shù)據(jù)源是數(shù)據(jù)準(zhǔn)備的關(guān)鍵任務(wù),對于Web文檔需要內(nèi)容解析,對于圖像型文本文檔需要文字識別,對于語音信息需要語音識別,對于數(shù)據(jù)庫表格需要進(jìn)行模式映射。因此,信息抽取和自動標(biāo)引兩項技術(shù)十分重要。

3.2 可視化數(shù)據(jù)空間

可視化數(shù)據(jù)空間是由需要進(jìn)行可視化展示的數(shù)據(jù)集合構(gòu)成的數(shù)據(jù)空間,是利用模式識別、數(shù)據(jù)挖掘、知識挖掘等技術(shù)對原始數(shù)據(jù)空間進(jìn)行處理形成的特征數(shù)據(jù)空間,具有一定的模式結(jié)構(gòu),能夠直接映射到視覺對象空間。可視化數(shù)據(jù)空間中的樹狀和網(wǎng)狀的數(shù)據(jù)結(jié)構(gòu)在計算機中可以以數(shù)據(jù)表形式存儲,可以以XML文檔格式存儲,計算時轉(zhuǎn)換為鏈表結(jié)構(gòu)或向量矩陣。

3.3 視覺對象空間

視覺對象空間是由一組視覺對象及其屬性構(gòu)成的用戶界面,是利用布局算法、填充算法、交互算法及優(yōu)化算法對可視化數(shù)據(jù)空間進(jìn)行映射和渲染形成的,直接呈現(xiàn)給用戶供其查看和操作。視覺對象可以是各種具有交互功能的圖形,如空間樹Space Tree、樹映射Treemap、大腦theBrain概念圖等。常用的視覺屬性包括位置、形狀、方向、色彩、紋理、灰度等級和尺寸等。在數(shù)據(jù)映射時,常常將可視化數(shù)據(jù)空間的數(shù)據(jù)關(guān)系映射為整體的視覺對象,將每個數(shù)據(jù)元素映射為視覺對象的某個屬性。

4 可視化繪制和可視化展示對知識轉(zhuǎn)化的影響

4.1 可視化繪制對知識轉(zhuǎn)化的影響

可視化繪制利用圖形關(guān)聯(lián)人類的認(rèn)知模式和計算機中知識的表示方式,能幫助隱性知識外化和顯性知識內(nèi)化的完成,其對知識轉(zhuǎn)化的影響體現(xiàn)在以下方面:

?組織復(fù)雜的知識結(jié)構(gòu)。利用可視化技術(shù)可以組織復(fù)雜的知識結(jié)構(gòu),在一幅圖片中能夠描述大量的知識內(nèi)容以及知識內(nèi)容之間的關(guān)系;同時,通過圖形的鏈接功能還可以關(guān)聯(lián)與知識節(jié)點相關(guān)的知識資源,為人類認(rèn)知模式的形成提供豐富的營養(yǎng)來源。

?促進(jìn)人員之問的協(xié)作??梢暬L制為人員之間的協(xié)作提供了簡捷、高效的交流平臺,充分利用了人類發(fā)散性思維和形象思維的優(yōu)勢,刺激人員提出更多的觀點;同時,能夠更為全面地揭示人員之間的認(rèn)知差異,消除知識表示中的誤解和曲解。

?增強知識吸收的能力。新認(rèn)知模式的形成不僅需要新知識,也需要舊知識。一方面,新經(jīng)驗以原來的經(jīng)驗為基礎(chǔ);另一方面,新經(jīng)驗的進(jìn)入又會使原有的經(jīng)驗發(fā)生一定改變。通過繪制圖形,能夠更為清晰地認(rèn)識新舊認(rèn)知模式之間的差異,促進(jìn)新認(rèn)知模式的形成。

4.2 可視化展示對知識轉(zhuǎn)化的影響

可視化展示充分利用計算機強大處理能力,將抽象數(shù)據(jù)直觀化和形象化,改善知識挖掘和知識導(dǎo)航的效果,促進(jìn)顯性知識的組織和利用,其對知識轉(zhuǎn)化的影響主要體現(xiàn)以下方面:

?快速定位資源??梢暬故灸軌蚪沂局R庫中復(fù)雜的結(jié)構(gòu)關(guān)系,能夠展示查詢擴展的結(jié)構(gòu)關(guān)系,能夠?qū)⑴c查詢相關(guān)的知識文檔的相關(guān)度直觀地顯示出來,能夠推薦相關(guān)的知識資源,為知識資源定位提供多種快捷、直觀的入口和途徑。

?識別隱藏模式??梢暬故咎峁┝擞^察數(shù)據(jù)的多種視圖,包括修剪、檢索、過濾和縮放等。修剪是將數(shù)據(jù)集合中的數(shù)據(jù)進(jìn)行修改或刪除;檢索是指通過檢索的方式定位數(shù)據(jù)源、中間結(jié)果或結(jié)果數(shù)據(jù)中的某些數(shù)據(jù)元素或集合;過濾是通過設(shè)定參數(shù)去除不符合要求的數(shù)據(jù);縮放是為用戶提供比例縮放、放大/縮小、導(dǎo)航/細(xì)節(jié)等功能。豐富的數(shù)據(jù)觀察方式便于識別隱藏的模式。

第4篇

關(guān)鍵詞:車輛檢測; 碰撞預(yù)警; 單目視覺; 智能車輛

中圖分類號:TN919-34; TP391.41 文獻(xiàn)標(biāo)識碼:A

文章編號:1004-373X(2011)20-0053-04

Vision-based Rear-end Collision Warning System in Car

LI Fei1, ZHAO Ming-hui2, Ye Qing2,Liu Zunyang2

(1. Key Laboratory of Atmospheric Composition and Optical Radiation, Anhui Institute of Optics and Fine Mechanics, CAS, Hefei 230031, China;

2. Hefei Tongzhi Technological Development Co., Ltd., Hefei 230037, China;

3. State Key Laboratory of Pulsed Power Laser Technology, Electronic Engineering Institute of PLA, Hefei 230037, China)

Abstract: Rear-end collision warning is an important research topic of intelligent vehicle vision navigation system. A monocular camera based rear-end collision warning system in car was developed, which can be applied to the structuralization road environment. The front road is identified by a new edge detection algorithm from images captured by camera.. The front cars are detected according to the characteristics such as shade of grey, edge and symmetry. The danger degree is judged according to the distance between cars. Acoustic and ocular warning signals are given to drivers. Experiment was conducted in highway around HeFei. The experimental results show that the system can meet the requirements of real-time for vehicle driving and can fulfill tasks of detection and warning.

Keywords: car detection; collision warning; monocular vision; intelligent vehicle

0 引 言

基于計算機視覺的高速公路防撞系統(tǒng)是當(dāng)前智能交通管理系統(tǒng)研究的熱點之一。如何在多變的環(huán)境下快速準(zhǔn)確地從視頻圖像里檢測到車道和前方車輛是實現(xiàn)這類系統(tǒng)面臨的最關(guān)鍵問題。近20年來,國內(nèi)外很多研究人員對這個問題進(jìn)行了大量研究,提出了多種多樣的實用算法并成功開發(fā)了一些視覺系統(tǒng)。這些系統(tǒng)所采用的算法基本上可以分為基于雙目視覺的方法、基于運動的方法、基于外形的方法和基于知識的方法?;陔p目立體視覺的方法計算量大,需要特殊硬件支持[1];基于運動的方法,無法檢測靜止目標(biāo)且實時性差[2];基于外形的方法,因建立有效的培訓(xùn)樣本仍然是需要研究的問題[3];基于知識的方法,在障礙物數(shù)量較少時效率較高,但復(fù)雜環(huán)境下錯誤率有所增加[4]。

針對常規(guī)算法的不足,本文設(shè)計了一種精度高,穩(wěn)定性好的基于單目視覺的車載追尾預(yù)警系統(tǒng)。它利用一種新的邊緣檢測算法識別前方道路,然后利用陰影檢測與跟蹤相結(jié)合的方法識別前方車輛,接下來根據(jù)前后車距判斷其威脅等級,最終向駕駛員提供相應(yīng)的聲光報警信號。

1 系統(tǒng)工作原理

系統(tǒng)硬件部分包括MCC-4060型CCD攝像機、VT-121視頻采集卡、GPS、PC-104工控機和顯示終端。GPS通過串口向工控機發(fā)送本車車速信息,安裝在車內(nèi)擋風(fēng)玻璃后的CCD攝像機將圖像幀通過視頻采集卡送入工控機,經(jīng)過軟件的處理分析后,在顯示終端上標(biāo)注出前車障礙物和道路標(biāo)線,同時根據(jù)車速、間距等判斷危險等級,發(fā)出相應(yīng)的聲光報警信號;

系統(tǒng)的軟件部分包括道路檢測、道路跟蹤、車輛檢測、車輛跟蹤、測距、決策和報警等模塊。當(dāng)車速達(dá)到60 km/h時,系統(tǒng)開始處理實時采集到的圖像序列。對于每一幀圖像,首先檢測并跟蹤圖像中的車道白線,然后在車道確定的感興趣區(qū)域內(nèi)檢測車輛。如果存在疑似障礙車輛,則啟動車輛跟蹤,利用跟蹤信息進(jìn)一步排除虛警。在實現(xiàn)對障礙車輛穩(wěn)定跟蹤后,估算出兩車間距和相對運動速度,判定其威脅等級,并發(fā)出相應(yīng)的報警信號。

2 系統(tǒng)關(guān)鍵技術(shù)

2.1 道路檢測

目前,車道線檢測算法主要適用于光照充足的環(huán)境下。由于車道線與路面之間對比度大,因此很容易利用各種常規(guī)邊緣檢測算子獲得清晰的車道輪廓信息,然后選取合適的閾值對圖像進(jìn)行二值化處理,最后采用Hough變換識別車道線[5-7]。然而在復(fù)雜光照環(huán)境下,圖像會受到各種光線直射和物體多次反射形成雜散光的干擾,圖像光強不能反映車道本身突變性質(zhì),導(dǎo)致無法正確檢測出車道。

本系統(tǒng)采用了一種利用光密度差得到車道標(biāo)線與路面反射率差,進(jìn)而進(jìn)行非線性邊緣檢測,再進(jìn)行Hough變換的車道檢測算法[8]。此算法可以有效解決在復(fù)雜光照條件下的車道檢測,也可以用于夜間的車道檢測。

另外,目前車道線的跟蹤研究主要采用固定區(qū)域法或者Kalman濾波法,根據(jù)前一幀車道線檢測的結(jié)果來劃分感興趣區(qū)域,以實時跟蹤車道線[9-11]。然而,固定區(qū)域法對2幀圖像的相關(guān)性依賴大,劃分感興趣區(qū)域大,實時性差;而Kalman濾波法劃分感興趣區(qū)域小,容易產(chǎn)生檢測誤差,而造成跟蹤誤差累積,跟蹤正確率不高。因此,本系統(tǒng)在跟蹤車道線時采用了一種融合固定區(qū)域法和Kalman濾波法劃分感興趣區(qū)域的新方法[12]。

一般來說,只將車道邊界線交點(即滅點)以下、2車道線之間的區(qū)域作為感興趣區(qū)域,考慮到跨道行駛的車輛依然對本車有威脅,算法把兩車道線分別向兩側(cè)平移40個像素,使感興趣區(qū)域擴展到可以覆蓋跨道車輛的范圍。

2.2 車輛檢測

圖像中包含車輛前方很大視野內(nèi)的物體,如道路、樹木、護(hù)欄、標(biāo)牌以及其他車輛,要從中準(zhǔn)確檢測出前方車輛是一項困難的工作,而本文的車輛檢測模塊會根據(jù)圖像背景自動改變設(shè)置參數(shù),以適應(yīng)不斷變化的道路場景和光照條件。

要實現(xiàn)車輛的快速檢測,首先需要根據(jù)車輛的基本特征進(jìn)行初步檢測,將所有可能的疑似車輛區(qū)域從圖像中提取出來,然后再根據(jù)其他特征對疑似區(qū)域進(jìn)行篩選排除。

2.2.1 車輛初步檢測

初步檢測采用的特征是車輛陰影,即一塊位于目標(biāo)車輛底部、灰度值明顯比附近路面區(qū)域低的區(qū)域。在一般環(huán)境條件下,大部分車輛都具有這一顯著特征。

車輛初步檢測的流程如圖1所示。車輛陰影和車道一樣具有灰度突變的特點,因此可以調(diào)用車道檢測算法對圖2(a)中的原始圖像做二值化處理,得到圖2(b)中的邊緣二值化圖像。同時還要對原始圖像進(jìn)行灰度二值化,得到圖2(c)中的灰度二值化圖像。為提高檢測實時性,以本車附近路面區(qū)域的平均灰度作為二值化閾值。由于邊緣二值化圖像和灰度二值化圖像都包括了車輛的下底邊,將這兩幅圖像進(jìn)行“或”運算,就可以得到如圖2(d)所示的車輛陰影圖像。

在陰影圖像中由下至上逐行搜索,尋找連續(xù)陰影點超過一定閾值的線段,并以此線段為底邊劃出一個矩形區(qū)域作為疑似車輛區(qū)域。為保證疑似區(qū)域包含車輛整體,矩形的寬度比線段稍寬,高度由寬度按比例給出。為避免重復(fù)搜索,將已搜索到的疑似區(qū)域內(nèi)陰影完全抹去。由于同一車輛的各個部分可能分別被檢測為疑似目標(biāo),因此還需要對各個相交的疑似區(qū)域進(jìn)行合并。由于前方車輛的遮擋,可能會將多個目標(biāo)認(rèn)定為一個目標(biāo),但是對本車的安全無影響。

2.2.2 篩選驗證

如果單純采用陰影特征進(jìn)行車輛檢測,在保證較低“漏警”率的同時,也造成了較高的“虛警”率,因此還需要對疑似區(qū)域進(jìn)行篩選和驗證。

對于結(jié)構(gòu)化道路,車輛寬度與車道寬度的比值應(yīng)該是大致固定的,那么當(dāng)攝像機的焦距、俯仰角等參數(shù)固定后,圖像上車道寬度(像素數(shù))與車輛寬度(像素數(shù))也滿足這個比例。根據(jù)之前檢測的車道方程,就可以計算出感興趣區(qū)域內(nèi)任意縱坐標(biāo)上車輛圖像寬度的范圍,并剔除寬度不在此范圍內(nèi)的疑似區(qū)域。

在以往的車輛驗證方法中,最常用的是對稱性測度驗證[13]。這種算法的計算量較大,且對于背景復(fù)雜,對稱度差圖像的驗證效果不盡人意。為了解決這個問題,該系統(tǒng)采用了一種基于邊緣二值化圖像,通過搜索車輛左右邊緣進(jìn)行驗證的算法。

假設(shè)疑似區(qū)域的寬度為W,區(qū)域左邊緣的坐標(biāo)為(X1,Y1),右邊緣的水平坐標(biāo)為(X2,Y2)。Фㄒ搴數(shù):

Иg(u)=∑u+1x=u-1∑Y1y=Y1-W/2f(x,y)И

式中:f(x,y)為(x,y)點的灰度值。在區(qū)間(X1-W/4,X1+W/4)內(nèi)搜索g(u)的最大值點,該點對應(yīng)的水平坐標(biāo)X1′就是車輛的左邊緣坐標(biāo)。同理也可以搜索到車輛的右邊緣X2′。如果左右邊緣的g(u)值均大于某閾值,那么就可以認(rèn)定該車輛確實存在。實驗證明,該算法能排除掉大量的“虛警”區(qū)域并得到真實車輛的兩側(cè)邊緣。

2.3 車輛跟蹤

現(xiàn)關(guān)心的是前方車輛與本車相對的二維位置和速度,因此只需要使用卡爾曼濾波器預(yù)測橫坐標(biāo)x、橫向速度Vx、縱坐標(biāo)y、縱向坐標(biāo)Vy這四個狀態(tài)向量。此外由于x方向和y方向的狀態(tài)向量沒有直接聯(lián)系,所以可以將其分為兩組分別處理。

在車輛行駛過程中,由于顛簸或遮擋等原因,系統(tǒng)可能會將路牌、灌木叢等物體誤認(rèn)為是車輛檢測出來,產(chǎn)生虛警。而這些虛警物體往往只能在連續(xù)數(shù)幀圖像中存在。如果不采取措施,系統(tǒng)就會時常產(chǎn)生短促的報警。當(dāng)圖像采樣間隔足夠短時,相鄰幀內(nèi)同一車輛的位置會具有很大的相關(guān)性。

系統(tǒng)采用檢測與跟蹤相結(jié)合的方法,根據(jù)第n幀圖像獲得的信息,預(yù)測車輛在第n+1幀圖像中的位置等信息,并與n+1幀圖像中實際檢測到的結(jié)果進(jìn)行比對。如果二者匹配度最大且超出一定值,則認(rèn)定為同一車輛,繼續(xù)進(jìn)行跟蹤、報警,否則認(rèn)為此車已被遮擋或消失,暫時不做處理,數(shù)幀后被剔除出去。

2.4 測距報警

車間測距通常采用幾何投影模型,采用了一種簡化的車距模型公式L×W=C,其中L為兩車間距,單位為m;W為圖像上目標(biāo)車輛處車道寬度,單位為pixel;C為常數(shù),Э賞ü事先的標(biāo)定獲得[14]。然而兩車間安全車距S采用文獻(xiàn)[15]推導(dǎo)的臨界安全車距公式動態(tài)得到。

ИS=0.36Vr+0.33Vb+Vr(2Vb-Vr)259(1)И

式中:Vr為相對車速,由對測出車距求導(dǎo)得到相對車速后進(jìn)行卡爾曼濾波得到;Vb為本車車速,вGPS得到。

如果告警頻率過高,容易使駕駛員麻痹大意,過低可能使駕駛員來不及做出反應(yīng),因此該系統(tǒng)采用由遠(yuǎn)至近的┤段報警。

若車距d≥1.5S,判定為3級威脅,發(fā)出長而緩的報警聲,提醒駕駛員前方有障礙物,但暫無危險;若車距S≤d≤1.5S,判定為2級威脅,發(fā)出較急促的報警聲,提醒駕駛員減速;若車距d≤S,判定為1級威脅,發(fā)出短而急的報警聲,提醒駕駛員制動;3種狀態(tài)下的告警聲差異很大,駕駛員可以很容易地根據(jù)報警聲判斷威脅等級。

3 試驗結(jié)果

系統(tǒng)框架及所有算法在Borland C++ Builder 6環(huán)境下編譯完成。為了驗證系統(tǒng)算法的可靠性和實時性,利用在合肥市環(huán)城高速公路上采集不同車型、不同路段、不同環(huán)境光下多組道路圖像作為測試序列,進(jìn)行了大量實驗。

圖3為典型道路場景下的實驗結(jié)果,圖3(a)為大型卡車;(b)為小型面包車;(c)為遠(yuǎn)距離處;(d)為近距離處的檢測結(jié)果。系統(tǒng)將檢測到的目標(biāo)用黑框標(biāo)記出來。

圖3 典型道路場景實驗結(jié)果

可以看出,系統(tǒng)能夠檢測到本車道內(nèi)不同距離上的各種車型車輛。在高速公路上的實驗結(jié)果表明,在最大車速100 km/h的情況下,系統(tǒng)在Celeron M 600 MHz處理器上的處理速度為8 j/s左右,也就是說處理一幀圖像的時間內(nèi)車輛行駛3~4 m,基本滿足實時報警的要求。在一般光照條件下,系統(tǒng)正常報警的縱向距離超過200 m,視場角遠(yuǎn)遠(yuǎn)大于雷達(dá)(一般為±7°)。

為了驗證單目視覺測距準(zhǔn)確性,在市內(nèi)道路上采集了前車與本車距離從5~100 m的一組圖像。對采集的圖像進(jìn)行處理后,根據(jù)公式推導(dǎo)出本車與前車距離以及實際距離見表1。表中數(shù)據(jù)顯示,單目視覺測距的相對誤差都在5%以內(nèi),可以滿足實際工作中測距告警的需要。

4 結(jié) 語

本文設(shè)計了一個基于單目視覺的汽車追尾預(yù)警系統(tǒng)。該系統(tǒng)采用了一種基于光密度差的道路檢測算法,并使用了一種以車輛陰影檢測為主、左右邊緣檢測為輔的車輛探測方法,同時采用了簡單、實用的測距和報警方法。高速公路上的實驗結(jié)果證明了該系統(tǒng)的實時性、魯棒性和準(zhǔn)確性。

該系統(tǒng)目前還沒有在雨霧天氣或缺少照明的夜間環(huán)境下進(jìn)行試驗,未來我們將針對這些使用環(huán)境對系統(tǒng)做進(jìn)一步改進(jìn)和優(yōu)化。

參考文獻(xiàn)

[1]BERTOZZI M, BROGGI A. Gold: a parallel real-time stereo vision system for generic obstacle and lane detection \. IEEE Trans. on Image Processing, 1998, 7 (1): 62-81.

[2] BARRON J, FLEET D, BEAUCHEMIN S. Performance of optical flow techniques \. Computer Vision, 1994, 12(1): 43-77.

[3]SUN Z,BEBIS G,MILLER R. On-road vehicle detection using gabor filters and support vector machines \. IEEE Digital Signal Processing,2002,2: 1019-1022.

[4] MAROLA G.. Using symmetry for detecting and locating objects in a picture \. Computer Vision. Graphics. and Image Processing, 1989,46(2): 179-195.

[5]沈`,李舜酩,柏方超,等.結(jié)構(gòu)化道路中車道線的單目視覺檢測方法[J].儀器儀表學(xué)報,2010,31(2):397-402.

[6] CHARBONNIER P, DIEBOLT F, GUILLARD Y, et al.Road markings recognition using image processing \//Proceedings of IEEE Conference on Intelligent Transportation System. Boston, MA: IEEE,1997: 912-917.

[7]BROGGI A. Robust real-time lane and road detection in critical shadow conditions \// Proceedings of IEEE International Symposium on Computer Vision, Coral Gables. Florida: IEEE,1995:353-359.

[8]葉慶,趙明輝,李菲,等.復(fù)雜環(huán)境下的夜間車道檢測研究[J].安徽大學(xué)學(xué)報:自然科學(xué)版,2008,32(6):44-47.

[9]周欣,黃席樾,樊友平,等.汽車智能輔助駕駛系統(tǒng)中的單目視覺導(dǎo)航技術(shù)[J].機器人,2003,25(4):289-295.

[10]REDMILL K A, UPADHYA S, KRISHNAMURTHY A. A Lane Tracking System for Intelligent vehicle applications \.IEEE, 2001:273-279.

[11]JEONG Seung Gweon. Real-time lane detection for autonomous navigation \// Proceedings of 2001 IEEE Intelligent Transportation Systems Conference. Oakland, CA: IEEE, 2001: 508-513.

[12]葉慶,趙明輝,李菲,等.夜間車道線檢測與跟蹤算法研究[J].現(xiàn)代電子技術(shù),2009,32(13):155-158.

[13]ZIELKE T, BRAUCKMANN M, SEELEN WV.Intensity and edge based symmetry detection with an application to car following \. CVGIP:Image Understanding, 1993, 58(2): 77-190.

[14]劉燕,劉浩學(xué).基于計算機視覺的單目攝影縱向車距測量系統(tǒng)研究[J].公路交通科技,2004,21(9):103-106.

第5篇

關(guān)鍵詞:增強現(xiàn)實;視線追蹤;應(yīng)用

增強現(xiàn)實(Augmented Reality簡稱AR)技術(shù)是近年來的一個研究熱點,有著廣泛的應(yīng)用前景。它是對現(xiàn)實世界的補充,使得虛擬物體從感官上成為周圍真實環(huán)境的組成部分。與傳統(tǒng)的虛擬現(xiàn)實(Virtual Reality簡稱VR)不同,增強現(xiàn)實只是實現(xiàn)對現(xiàn)實環(huán)境的增強,加深了對現(xiàn)實環(huán)境的感受。在實際的AR體驗中,因為人的觀察視線會不斷地變化,AR系統(tǒng)需要實時的根據(jù)用戶的視場重新建立位置坐標(biāo)系,進(jìn)行追蹤。而視線追蹤技術(shù)就是實時地跟蹤用戶頭部的位置和視線方向,根據(jù)這些信息來確定虛擬物體在真實空間坐標(biāo)中的位置,并將它實時地顯示在顯示器中的正確位置。

一、視線追蹤技術(shù)及其特點

(一)視線追蹤技術(shù)概述。

視線追蹤也稱為眼動追蹤,它被認(rèn)為是研究視覺信息加工的有效手段。利用專用設(shè)備來記錄學(xué)習(xí)者的眼球運動(Eve-Movement,簡稱眼動)情況,可以作為分析學(xué)習(xí)者內(nèi)部心理活動情況的依據(jù)。關(guān)于視線追蹤技術(shù)的研究己有較長歷史,目前它己在多個領(lǐng)域得到廣泛應(yīng)用。例如用于圖片廣告研究(網(wǎng)頁評估、設(shè)計評估等)、動態(tài)分析(航空航天、體育運動、汽車、飛機駕駛等)、產(chǎn)品測試(可用性測試)、場景研究(商場購物、店鋪裝演、家居環(huán)境等)和人機交互等多個領(lǐng)域。此外,視線追蹤在智能計算機、智能家電、虛擬現(xiàn)實和數(shù)字游戲等領(lǐng)域也有很好的應(yīng)用前景。

在眼動實驗研究中,當(dāng)被試對視覺信息進(jìn)行提取時,其注視時間、注視次數(shù)、注視點序列、眼跳距離、回視次數(shù)、瞳孔直徑等通常被視為思維和心理加工的重要參數(shù)。因此,通過對被試在學(xué)習(xí)過程中的實時眼動信息進(jìn)行觀測,可用于分析和引導(dǎo)其學(xué)習(xí)的依據(jù)。眼動模式一般分為三種:注視(fixation)、眼跳(saccade)和追隨運動(pursuit movement)。其中,持續(xù)一段時間、相對穩(wěn)定的眼球運動稱為注視;眼球快速運動時導(dǎo)致視覺區(qū)域的聚焦點產(chǎn)生變化,這種行為稱為眼跳;眼睛緩慢、平滑地追蹤某個緩慢運動的目標(biāo),則稱為追隨運動。通過分析眼動模式和相關(guān)參數(shù),可以獲得很多重要的信息。例如,眼跳速度會隨著疲倦程度的增加而降低,而隨著學(xué)習(xí)任務(wù)難度的增加而增加;眨眼速度和眼睛睜開程度的降低則可能意味著疲倦的加重。因此,可以據(jù)此來確定學(xué)習(xí)者的學(xué)習(xí)精神狀態(tài),或?qū)ζ鋵W(xué)習(xí)過程進(jìn)行分析,從而采取相應(yīng)的學(xué)習(xí)策略或干預(yù)措施。

(二)視線追蹤系統(tǒng)的類型及其特點。

人眼的注視點主要由頭的方位和眼睛視線決定。頭的方位決定了人眼可能注視的范圍,眼睛的視線決定了注視點的精確位置。國內(nèi)外將視覺跟蹤技術(shù)按照借助的媒介分為硬件和軟件兩種。以硬件為基礎(chǔ)的視線跟蹤的基本工作原理是利用圖像處理技術(shù),通過攝像機攝入瞳孔反射的紅外線記錄視線變化,達(dá)到視線追蹤的目的。視線跟蹤裝置目前有穿戴式與非穿戴式,接觸式與非接觸式,如帶上專用頭盔、眼鏡或者頭部固定支架,置于頭部上的攝像機,這種情形用戶使用較不舒適。通過軟件實現(xiàn)的視線跟蹤方法,對用戶沒有干擾,首先利用攝像機獲取頭部、臉部或眼睛圖像,再經(jīng)過軟件分析對視線定位與跟蹤。由于不需要佩戴任何裝置,用戶的自由度舒適度較好。

人與計算機交互是研究人與計算機之間溝通的技術(shù),將視線跟蹤、語音識別、手勢輸入、感覺反饋等引入人機交互,提高了交互的自然性和高效性。視線追蹤技術(shù)同樣引發(fā)了人機交互系統(tǒng)的改革,鼠標(biāo)、觸控板的消失,及通過追蹤人眼視線,用眼神來操作電腦、輸入文字、玩游戲。

二、視線追蹤技術(shù)在AR增強現(xiàn)實研究中的應(yīng)用

(一)顯示技術(shù)。

AR的簡單定義就是將計算機生成的虛擬數(shù)字信息疊加到現(xiàn)實的生活場景中。這個“疊加”是需要通過顯示設(shè)備作為中介來實現(xiàn)。

增強現(xiàn)實系統(tǒng)中的顯示器可以分為頭盔顯示器(HMD)和非頭盔顯示設(shè)備。目前,一般的增強現(xiàn)實系統(tǒng)主要使用透視式頭盔顯示器。透視式頭盔顯示器主要由三個基本環(huán)節(jié)構(gòu)成:虛擬信息顯示通道、真實環(huán)境顯示通道、圖像融合及顯示通道。其中,虛擬信息的顯示原理與虛擬現(xiàn)實系統(tǒng)所用的浸沒式頭盔顯示器基本相同;圖像融合與顯示通道是與用戶交互的最終接口,根據(jù)其中真實環(huán)境的表現(xiàn)方式,可分為基于CCD攝像原理的視頻透視式頭盔顯示器和基于光學(xué)原理的光學(xué)透視式頭盔顯示器兩類。

光W透視技術(shù)是通過安裝在設(shè)備眼前的光學(xué)透鏡來呈現(xiàn)出真實和虛擬世界。首先計算機生成的虛擬信息經(jīng)過光學(xué)系統(tǒng)放大后反射后進(jìn)入視野,透過透鏡又能直接看到現(xiàn)實場景,兩部分的信息匯聚到人眼的視網(wǎng)膜上實現(xiàn)AR的效果。視頻透視技術(shù)是借助安裝在頭顯上的攝像頭來捕捉獲取外部真實環(huán)境,計算機將數(shù)字模擬信息疊加到攝像機的視頻信號上,再將真實場景和虛擬場景進(jìn)行融合。相比較光學(xué)透視技術(shù),它的視角場更大,而且不受外界的強光干擾。不過一旦攝像機與用戶的視點不能保持完全重合,會產(chǎn)生一些偏差。

(二)跟蹤注冊技術(shù)。

基于計算機視覺的注冊技術(shù)主要是指利用計算機視覺獲取真實場景的信息后,經(jīng)過圖像處理方面的知識來識別和跟蹤定位真實場景。細(xì)分可以劃為基于傳統(tǒng)標(biāo)志的注冊算法和基于自然特征點無標(biāo)志注冊算法?;谟嬎銠C視覺的注冊技術(shù)的精度較高,但是對計算量非常大,而且算法復(fù)雜,對系統(tǒng)的要求非常高。

為了取長補短,得到更加精確的注冊結(jié)果,現(xiàn)在有結(jié)合兩種技術(shù)的混合注冊方法。通常是先由跟蹤傳感器大概估計位置姿態(tài),再通過視覺法進(jìn)一步精確調(diào)整定位。一般采用的復(fù)合法有視覺與電磁跟蹤結(jié)合、視覺與慣導(dǎo)跟蹤結(jié)合、視覺與GPS跟蹤結(jié)合等。

三、結(jié)論

在國外,增強現(xiàn)實早已在醫(yī)學(xué)、遙操作、制造與維修、可視化與教育培訓(xùn)、娛樂、軍事訓(xùn)練等領(lǐng)域取得了成功應(yīng)用。在國內(nèi),不少單位和個人對增強現(xiàn)實中的關(guān)鍵技術(shù)和算法進(jìn)行了研究,并且以牙科醫(yī)學(xué)、設(shè)備維修等許多背景得到了初步應(yīng)用研究。但國內(nèi)的研究目前仍多限于實驗階段,與國外的應(yīng)用水平還有一定距離。

目前,隨著增強現(xiàn)實的快速發(fā)展,出現(xiàn)了許多新的研究方向,如新的顯示方式、照片真實感圖形繪制、調(diào)節(jié)現(xiàn)實、基于網(wǎng)絡(luò)的增強現(xiàn)實和針對戶外隨身增強現(xiàn)實系統(tǒng)的技術(shù)等等。其中涉及到的技術(shù)包括基于圖像的繪制(IBMR)、多通道信息融合、普適計算技術(shù)、顯示設(shè)備和跟蹤設(shè)備的隨身便攜化等。隨著系統(tǒng)性能的提高、操作過程的簡化和設(shè)備成本的降低,增強現(xiàn)實會在越來越多的領(lǐng)域得到廣泛應(yīng)用。

參考文獻(xiàn):

[1]奚惠寧等.視線追蹤應(yīng)用技術(shù)的專利分析[J].電視技術(shù),2013(S2)。

第6篇

【關(guān)鍵詞】自動分級;機器視覺;支持向量機

一、概述

烤煙是卷煙工業(yè)的原料,其煙葉質(zhì)量的好壞直接關(guān)系到煙草制品的工藝配方和生產(chǎn)質(zhì)量??緹煙熑~分級方法是目前評判煙葉質(zhì)量的主要手段,其分級判斷的依據(jù)主要是煙葉的外觀特征,如顏色、長度、厚度、油分、成熟度,殘損等。目前國內(nèi)外煙草行業(yè)對煙葉的分級和檢驗都是依據(jù)分級標(biāo)準(zhǔn),以人工操作為主,憑借標(biāo)準(zhǔn)樣本依靠人的感官進(jìn)行的。這種傳統(tǒng)的人工檢驗方法容易受人的因素影響,評級定價難以做到公平、公正。而且在我國,每年煙葉收購前,全國各地都會舉辦培訓(xùn)班,培訓(xùn)分級人員,并準(zhǔn)備大量的樣本發(fā)往各地,這樣必然造成人力、物力和財力的巨大消耗。機器視覺技術(shù)的發(fā)展和國家煙葉等級標(biāo)準(zhǔn)的定量化促進(jìn)了煙葉分級自動化和智能化的應(yīng)用與發(fā)展,各種圖像處理算法和模式識別方法也被應(yīng)用于煙葉的自動分級中,如2003年,張惠民等人根據(jù)提取的煙葉特征參數(shù),建立并優(yōu)化了烤煙煙葉分級系統(tǒng)的數(shù)學(xué)模型,構(gòu)造了符合烤煙煙葉等級空間分布的高斯隸屬函數(shù),采用模糊推理機制原理來實現(xiàn)煙葉分級。2011年,張樂明、劉劍君等以紅外光譜作為煙葉的特征,采用概率神經(jīng)網(wǎng)絡(luò)對11個等級的煙葉進(jìn)行分組和分級。

二、支持向量機基本原理

支持向量機(Support Vector Machine)簡稱SVM,是由Vapnik于1995年一種新的機器學(xué)習(xí)技術(shù)。支持向量機方法是建立在統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小化原理基礎(chǔ)上的,根據(jù)有限的樣本信息在模型的復(fù)雜性(即對特定訓(xùn)練樣本的學(xué)習(xí)精度)和學(xué)習(xí)能力(即無錯誤的識別任意樣本的能力)之間尋求最佳折中,以期獲得最好的推廣能力。

1.最優(yōu)分類面。SVM方法是從線性可分情況下的最優(yōu)分類面提出的。首先考慮二維兩類線性可分的情況,如圖1所示,圖中實心點和空心點分別表示兩類訓(xùn)練樣本,H為把兩類沒有錯誤地分開的分類線,H1、H2分別為各類樣本中離分類線最近的點且平行于分類線的直線。所謂最優(yōu)分類線就是要求分類線不但能將兩類無錯誤地分開,而且要使兩類的分類間隔最大。

三、實驗結(jié)果及分析

本文首先利用利用圖像采集裝置得到煙葉的原始圖像作為樣本并對煙葉圖像進(jìn)行了圖像預(yù)處理。然后根據(jù)煙葉的顏色、外形、紋理特征建立了煙葉分級的支持向量機識別模型;最后利用部分樣本進(jìn)行檢驗。實驗中樣本得到了較高的識別率。實驗結(jié)果說明了SVM分類器算法能夠較好地完成樣品集的分類,它是在基于結(jié)構(gòu)風(fēng)險最小化理論之上構(gòu)建最優(yōu)分割超平面,使得分類器能夠得到全局最優(yōu)化,并且在整個樣本空間的期望風(fēng)險以某個概率滿足一定上界,在實際應(yīng)用中有較好的優(yōu)勢。

四、結(jié)論

支持向量機是是在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來的一種新型的機器學(xué)習(xí)方法。作為一種尚未成熟的技術(shù),支持向量機盡管在核函數(shù)的參數(shù)的構(gòu)造和選擇上缺乏相應(yīng)的理論指導(dǎo),但是由于它在解決小樣本學(xué)習(xí)問題中的優(yōu)勢,使其成為機器學(xué)習(xí)領(lǐng)域的研究熱點,并且被廣泛地應(yīng)用于各行各業(yè)。本文將支持向量機的方法運用于煙葉的自動分級系統(tǒng)。取得了較好的分類效果。

參 考 文 獻(xiàn)

[1]閻瑞瓊,韓立群,陳晉東.計算機技術(shù)在煙葉檢測與分級領(lǐng)域的應(yīng)用[J].煙草科技.2001,154(3):13~15

[2]張惠民,韓立群,段正剛.基于圖像特征的煙葉分級[J].武漢大學(xué)學(xué)報.2003(3)

[3]張樂明,申金媛,劉劍君,劉潤杰.概率神經(jīng)網(wǎng)絡(luò)在煙葉自動分級中的應(yīng)用[J].農(nóng)機化研究.2011(12)

第7篇

關(guān)鍵詞: 虛擬現(xiàn)實; 雙目視差; 近距顯示; 視覺舒適度

中圖分類號: TN27?34; TM417 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)01?0140?05

Abstract: The virtual reality technology developed rapidly, and has been widely used in many fields, but the traditional CAVE system is difficult to promote and popularize due to the large floor space, high cost and difficult installation and adjustment, therefore, the research and development of the portable CAVE system has great significance to the popularization and development of the virtual reality technology. According to the features of the portable CAVE system, the visual optical system was designed, the distortion correction of the projected image and random dot stereogram generation algorithm are studied, and the close range stereoscopic display system based on visual optical system adjustment was built. The subjective evaluation experiment of the visual comfort degree was designed and implemented to explore the relationship between the visual fatigue degree and parallax caused by the close range display. The visual comfort degree of the stereoscopic display system based on visual optical system was assessed. This technology provides a reference foundation for the study of the portable CAVE system, and has a certain practical significance to the development of the virtual reality technology and the study of the stereoscopic visual comfort degree.

Keywords: virtual reality; binocular disparity; close range display; visual comfort degree

0 引 言

近年恚虛擬現(xiàn)實技術(shù)發(fā)展迅速,已經(jīng)被廣泛應(yīng)用于軍事訓(xùn)練、醫(yī)學(xué)實習(xí)、娛樂游戲等諸多領(lǐng)域。傳統(tǒng)的虛擬現(xiàn)實顯示系統(tǒng)雖然技術(shù)成熟,但存在一些弊端,因此便攜式CAVE系統(tǒng)的概念應(yīng)運而生。本文搭建了近距立體顯示原型系統(tǒng),通過主觀實驗,探究了便攜式CAVE系統(tǒng)中雙目視差的感知深度和單眼聚焦感知深度的差異,以及用戶可接受的視覺舒適范圍,對基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)的視覺舒適度進(jìn)行評估。

1 立體視覺舒適度的評估方法

1.1 刺激方法的選擇

為了避免視差的時間積累效應(yīng),實驗采用雙刺激連續(xù)分級法。為控制實驗過程中產(chǎn)生的習(xí)慣誤差,不同視差的立體圖按照隨機序列交替呈現(xiàn),且各視差出現(xiàn)的次數(shù)相等,整個序列中在前在后的機會相等。

實驗的具體刺激方法是:將波紋中心在零視差處的刺激物記為基準(zhǔn)圖波紋中心在其他位置的刺激物記為待評估圖每次施測依次顯示三個刺激物,其順序為或者其目的是強迫用戶改變雙眼的輻輳角度。每個刺激物顯示1.5 s,三個刺激物共顯示4.5 s,不同視差的待評估圖像隨機出現(xiàn)。被試者要獨立地進(jìn)行觀測,選出其中一個與其他兩個波動方向不同的刺激物,并對該過程的視覺舒適度進(jìn)行主觀評分。同一組圖像需隨機顯示兩次以便對評分結(jié)果進(jìn)行一致性檢查。

1.2 反應(yīng)指標(biāo)的選擇

反應(yīng)指標(biāo)的選擇應(yīng)依據(jù)以下原則:

(1) 無害性。所選取的反應(yīng)指標(biāo)不應(yīng)對被試者產(chǎn)生身體傷害,同時不能對被試者產(chǎn)生負(fù)面心理影響,阻礙實驗的繼續(xù)進(jìn)行。

(2) 無干擾性。所選取的反應(yīng)指標(biāo)在測量過程中不能干擾被試者正常觀看圖像。

(3) 敏感性。所選反應(yīng)指標(biāo)應(yīng)該能夠有效地反應(yīng)出視覺舒適度和視覺疲勞程度。

根據(jù)分析,實驗主要采用主觀評估方法對視覺舒適度進(jìn)行研究。主觀評價方法更適用于對視覺舒適度進(jìn)行綜合評價。舒適度的主觀評價方法[1]主要是讓被試者在觀看立體圖像前后根據(jù)自身的視覺狀況填寫問卷,并對問卷的結(jié)果進(jìn)行統(tǒng)計分析。

1.3 主觀量表設(shè)計方法

主觀量是指用戶對客觀刺激產(chǎn)生的主觀度量,又稱心理量[2]。在視覺實驗中,主觀評估方法需對被試者心理量進(jìn)行測量。主觀實驗中的心理度量表主要包括:強迫選擇度量表、圖示度量表和數(shù)值度量表。

(1) 強迫選擇度量表。強迫選擇度量表是在主觀評估實驗時主試者提供一些對立相反的詞語讓被試者做出選擇。強迫選擇度量表可以避免被試者受到他人的影響,但可能會使被試者產(chǎn)生抵觸情緒,因為大多數(shù)人不愿意讓自己處于兩難選擇的境地。

(2) 圖示度量表。圖示度量表好比一個溫度計,通常用一條直線表示,直線兩端具有相反程度的詞語。這條直線可以是水平的,也可以是垂直的。實驗中被試者需在直線上做標(biāo)記,實驗后主試者用標(biāo)尺對標(biāo)記進(jìn)行度量,將它轉(zhuǎn)換成數(shù)字并進(jìn)行統(tǒng)計。圖示度量表的數(shù)據(jù)統(tǒng)計工作較為復(fù)雜和繁瑣,本文實驗的數(shù)據(jù)量巨大,因此圖示度量表并不適用。

(3) 數(shù)值度量表。在數(shù)值度量表中,被試者根據(jù)事先定義的數(shù)字等級進(jìn)行評定,一般為7級評分或5級評分。在視覺舒適度研究中,可設(shè)計度量表如下:非常舒適、舒適、一般、不舒適、非常不舒適。設(shè)定等級分值時可以考慮“非常不舒適”為-2分,“不舒適”為-1分,“一般”為0分,“舒適”為1分,“非常舒適”為2分;也可以考慮“非常不舒適”為1分,“不舒適”為2分,“一般”為3分,“舒適”為4分,“非常舒適”為5分。通常情況下不管哪種處理和分析得到的結(jié)果是等效的。

本文實驗為了使被試者容易理解,考慮一般人的思維模式,將數(shù)值度量表等級設(shè)計為:“非常舒適”為1分,“舒適”為2分,“一般”為3分,“不舒適”為4分,“極不舒適”為5分。舒適度量表如表1所示。

2 近距立體顯示實驗系統(tǒng)

2.1 目視光學(xué)系統(tǒng)

在便攜式CAVE系統(tǒng)中,需要利用目視光學(xué)系統(tǒng)調(diào)節(jié)用戶眼睛的調(diào)節(jié)距離,使人眼不再聚焦于屏幕上。本文實驗的目的是研究經(jīng)過目視光學(xué)系統(tǒng)調(diào)節(jié)后的單眼調(diào)節(jié)距離和雙眼輻輳距離的差異對用戶視覺舒適度的影響。實驗中需通過改變目視光學(xué)系統(tǒng)的屈光度來改變被試者單眼的調(diào)節(jié)距離??紤]到人眼作為自然界的最高級光學(xué)接收系統(tǒng),具有極強的自我適應(yīng)和調(diào)節(jié)能力,因此,本系統(tǒng)選用單片式目鏡即可滿足基本的成像要求。

2.2 隨機點立體圖的生成

隨機點立體圖像對的生成算法如下:

設(shè)基面為視差面為

(1) 將基面沿縱方向均分成塊,左邊第一塊區(qū)域為原始區(qū),其余各塊區(qū)域均為重復(fù)區(qū)域。重復(fù)間距為d必須小于瞳距。

(2) 在原始區(qū)內(nèi)畫一個隨機點

(3) 令得到一新的點如果點在面內(nèi),則令如果點不在面內(nèi),則令然后在處畫出這個新點。

(4) 重復(fù)上述步驟(2)、步驟(3),直到圖面上布滿適當(dāng)密度的隨機點為止。

2.3 投影圖像的畸變矯正

本系統(tǒng)應(yīng)采用側(cè)投影的方式,在這種情況下投影圖像會產(chǎn)生畸變,應(yīng)進(jìn)行投影圖像的畸變矯正。進(jìn)行投影圖像的畸變矯正的模型是將真實投影機的投影圖像變換為虛擬投影機的投影圖像,從而恢復(fù)原始圖像[5]。其基本過程是:根據(jù)透視變換原理,先計算出投影機圖像平面到投影平面的單映矩陣,再將投影機圖像平面上的所有像素點乘以這個單映矩陣后進(jìn)行顯示,那么屏幕上獲得的圖像就是校正后的圖像。

3 近距立體顯示系統(tǒng)的舒適度評估實驗

3.1 實驗?zāi)康募霸?/p>

本實驗的主要目的是研究基于目視光學(xué)系統(tǒng)調(diào)節(jié)的近距立體顯示系統(tǒng)中單眼感知深度(調(diào)節(jié)距離)和雙眼感知深度(輻輳距離)[5]的差異對用戶視覺舒適度的影響。

由式(8)可知,當(dāng)眼睛到屏幕的距離和瞳距一定時,通過改變立體圖像對的水平視差可以改變被試者的雙眼感知深度(輻輳距離)。

3.2 被試者篩選及培訓(xùn)

篩選工具:數(shù)字化立體視覺檢查圖(立體視覺檢查卡、立體視銳度檢查卡)、瞳距測量尺。

本實驗被試者的篩選流程如下:

第一步:詢問被試者眼部的健康狀況、有無色盲、是否做過眼部手術(shù)、是否有眼部病史,如結(jié)膜炎、眼眶骨折等,篩選出眼睛健康且無病史的被試者。

第二步:進(jìn)行立體視覺測試,檢查被試者的雙目立體視覺是否正常,排除立體盲。

第三步:對立體視覺正常的被試者進(jìn)行立體視銳度測試,篩選出立體視銳度小于60 arcmin的被試者。

第四步:對被試者的年齡、性別、視力、瞳距、有無主觀實驗經(jīng)驗、是否從事立體視覺相關(guān)工作等基本信息進(jìn)行記錄[6]。

榱吮苊獗皇哉哂捎誆皇煜な笛榱鞒毯筒僮鞴程而影響實驗結(jié)果的準(zhǔn)確性,實驗前需對被試者進(jìn)行相關(guān)培訓(xùn)和模擬練習(xí)。

首先,采用無偏向性的語氣向被試者講解實驗?zāi)康摹⒃u價類型、評價等級和時間限制等內(nèi)容,使被試者正確透徹地理解評判標(biāo)準(zhǔn),并向被試者展示舒適度明顯不同的若干立體圖像示例。

然后,讓被試者進(jìn)行模擬練習(xí),模擬練習(xí)的內(nèi)容與正式的實驗過程類似。被試者連續(xù)觀看三組立體圖像后,用選擇器輸入差異圖像的編號并對該組立體圖像引起的視疲勞程度進(jìn)行評分,練習(xí)時間為3 min。

培訓(xùn)完成后,被試者即可進(jìn)行正式的主觀視覺舒適度評價實驗。

3.3 實驗過程

實驗1:探究近距顯示引起的視覺疲勞與視差的關(guān)系

被試者佩戴屈光度為0的目視光學(xué)系統(tǒng),在距離屏幕0.6 m的位置觀察隨機出現(xiàn)的立體圖像,并進(jìn)行視覺任務(wù)測試和主觀舒適度評分。實驗1設(shè)定刺激物的中心到被試者的距離(輻輳距離)分別為0.79 m,0.94 m,1.15 m,1.50 m,2.14 m,3.75 m,且隨機出現(xiàn)。調(diào)節(jié)距離為0.6 m。

實驗1共進(jìn)行36組小測試。每組測試會連續(xù)出現(xiàn)3幅立體圖像,被試者雙眼融像[7]后,可看到立體圖像出現(xiàn)正弦波紋的效果,被試者需選出一個與其他兩個正弦波動方向不同的立體圖像,利用選擇器將它的編號輸入到主機系統(tǒng)中。然后對該組小測試產(chǎn)生的視覺疲勞癥狀進(jìn)行主觀評分。

時間安排及流程:三種位置(1,2,3)×6種輻輳距離(0.79 m,0.94 m,1.15 m,1.50 m,2.14 m,3.75 m)×2種顯示序列(B?Xi?B或Xi?B?Xi)=36次施測,每次施測時間為1 min×36次=36 min。

實驗2:探究基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體視覺舒適度

被試者隨機佩戴屈光度分別為的目視光學(xué)系統(tǒng),在距離屏幕0.6 m的位置依次進(jìn)行3個亞組的實驗,實驗2中設(shè)定刺激物的中心到被試者的距離(輻輳距離)分別為0.79 m,0.94 m,1.15 m,1.50 m,2.14 m,且隨機出現(xiàn)。人眼的調(diào)節(jié)距離分別為1.09 m,1.50 m,2.40 m。

實驗2中每個亞組各進(jìn)行30組小測試。每組測試會連續(xù)出現(xiàn)3幅立體圖像,被試者雙眼融像后,可以看到立體圖像出現(xiàn)正弦波紋的效果,被試者需選出一個與其他兩個正弦波動方向不同的立體圖像,利用選擇器將它的編號輸入主機中,然后對該組小測試產(chǎn)生的視覺疲勞癥狀進(jìn)行主觀評分。

時間安排及流程:3種透鏡度數(shù)×3種位置(1,2,3)×5種輻輳距離(0.79 m,0.94 m,1.15 m,1.50 m,2.14 m)×2種顯示序列(B?Xi?B或Xi?B?Xi)=90次施測,每次施測調(diào)節(jié)時間為1 min×90+15 min間隔休息×2=120 min。

3.4 實驗結(jié)果分析

(1) 近距顯示引起的視覺疲勞與視差絕對值[8]呈正相關(guān)

將實驗1中24個被試者的舒適度主觀評分根據(jù)不同的輻輳距離進(jìn)行均值統(tǒng)計。當(dāng)視差取絕對值時,視差絕對值和視覺舒適度主觀評分值經(jīng)過線性擬合后得到兩者的關(guān)系模型為:

視差絕對值和視覺舒適度主觀評分值的線性相關(guān)度為具體見圖2。實驗結(jié)果表明,視覺舒適度的主觀評分與視差值呈線性關(guān)系,也就是說,對于近距立體顯示單眼聚焦和雙眼輻輳的不一致性所引起的視覺疲勞與立體視差值成正比關(guān)系。單眼聚焦和雙眼輻輳的差異越大,產(chǎn)生的視疲勞程度越大,這個結(jié)果與大部分研究結(jié)果相一致。

(2) 主觀舒適度與理論值的符合度基本一致

將實驗2中24個被試者的視覺舒適度主觀評分根據(jù)不同的輻輳距離和調(diào)節(jié)距離進(jìn)行均值統(tǒng)計,并將每個亞組的理論舒適度和實驗獲得的主觀舒適度進(jìn)行比較。

目視光學(xué)系統(tǒng)的屈光度為0.75D,1.00D,1.25D的實驗結(jié)果,如圖3~圖5所示。

實驗結(jié)果表明,當(dāng)調(diào)節(jié)距離一定時,分別為1.09 m,1.5 m,2.4 m,由輻輳距離的改變引起的視疲勞癥狀與理論計算得到的結(jié)果在總趨勢上大體一致。在基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)中,輻輳距離越小,符合度越好。在相同視差條件下,經(jīng)過目視光學(xué)系統(tǒng)調(diào)節(jié)后產(chǎn)生更大的不適感。

(3) 視差舒適度曲線

將實驗2中三個亞組的所有情況的視差值與主觀舒適度評分進(jìn)行綜合統(tǒng)計,繪制舒適度曲線如圖6所示。

實驗結(jié)果表明,基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)中,視差絕對值越小,視覺舒適度越高。在同等視差條件下,非交叉視差的舒適度優(yōu)于交叉視差。與傳統(tǒng)立體顯示設(shè)備相比,舒適視域向非交叉視差方向偏移。

4 結(jié) 論

本文在充分了解雙目立體視覺原理、視差型立體顯示技術(shù)原理、立體顯示引起視覺疲勞的根本原因等理論知識的基礎(chǔ)上,搭建近距虛擬現(xiàn)實顯示系統(tǒng)原型作為實驗系統(tǒng),設(shè)計實驗研究了基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)的視覺舒適度問題。對虛擬現(xiàn)實技術(shù)的發(fā)展和立體視覺舒適度的研究具有一定的實際意義。

參考文獻(xiàn)

[1] 張英靜,李素梅,衛(wèi)津津,等.立體圖像質(zhì)量的主觀評價方案[J].光子學(xué)報,2012,41(5):602?607.

[2] KIM D, CHOI S, SOHN K. Visual comfort enhancement for stereoscopic video based on binocular fusion characteristics [J]. IEEE transactions on circuits and systems for video technology, 2013, 23(3): 482?487.

[3] 王飛,王晨升,劉曉杰.立體顯示技術(shù)的原理、體視因素和術(shù)語[J].工程圖學(xué)學(xué)報,2010(5):69?73.

[4] 李志永.立體視覺基礎(chǔ)[J].現(xiàn)代電影技術(shù),2011(1):52?55.

[5] 顧郁蓮,蔡宣平.計算機立體視圖繪制技術(shù)[J].國防科技參考,1998,19(1):63?70.

[6] 敬萬鈞.虛擬現(xiàn)實中的視覺系統(tǒng)與其實現(xiàn)技術(shù)[J].計算機應(yīng)用,1997,17(3):5?7.