本發(fā)明涉及一種視頻錄播技術(shù)領(lǐng)域,尤其涉及教育錄播系統(tǒng)的控制技術(shù)。
背景技術(shù):
隨著教育產(chǎn)業(yè)的發(fā)展,錄播技術(shù)也得到了廣泛的應(yīng)用。但是,目前的錄播系統(tǒng)存在諸多缺點(diǎn),例如,智能化程度不高,錄制時(shí)需要導(dǎo)播人工切換;后期的剪輯制作需要專業(yè)人員,比較復(fù)雜;音頻拾取需要用手拿著麥克風(fēng),否則達(dá)不到良好的錄音效果,等等。因此,錄播的效率較低。
綜上所述,本領(lǐng)域迫切需要一種效率更高的教育錄播技術(shù)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的就是提供一種具有智能切換功能的錄播方法及系統(tǒng),具有更高的智能化程度,效率更高,用戶體驗(yàn)更好。
在本發(fā)明的第一個(gè)方面,提供了一種具有智能切換功能的錄播方法,包含:
通過(guò)第一攝像機(jī)拍攝講臺(tái)區(qū)域的第一視頻數(shù)據(jù),同時(shí),通過(guò)第二攝像機(jī)拍攝學(xué)生區(qū)域的第二視頻數(shù)據(jù),并從該第一視頻數(shù)據(jù)中提取教師畫面,將當(dāng)前的錄播畫面切換為該教師畫面;
實(shí)時(shí)地對(duì)該第二視頻數(shù)據(jù)進(jìn)行圖像分析,獲得該第二視頻數(shù)據(jù)中的每一個(gè)臉部的中心位置對(duì)應(yīng)的水平坐標(biāo)值和垂直坐標(biāo)值,和像素點(diǎn)總數(shù);
如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻幀中,存在一個(gè)臉部的垂直坐標(biāo)值的變化量大于預(yù)定門限,且變化方向?yàn)橄蛏希⑶以撃槻康南袼攸c(diǎn)總數(shù)的變化量小于預(yù)定門限,確定該臉部為發(fā)言學(xué)生臉部,并從該第一視頻數(shù)據(jù)中提取教師畫面,從該第二視頻數(shù)據(jù)中提取該發(fā)言學(xué)生臉部畫面,并將當(dāng)前的錄播畫面切換為該教師畫面和該發(fā)言學(xué)生臉部畫面的組合。
在本發(fā)明的優(yōu)選例中,本方法還包括以下步驟:
當(dāng)錄播畫面為教師畫面和發(fā)言學(xué)生臉部畫面的組合狀態(tài)時(shí),
如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻幀中,存在一個(gè)臉部的垂直坐標(biāo)值的變化量大于預(yù)定門限,且變化方向?yàn)橄蛳拢⑶以撃槻康南袼攸c(diǎn)總數(shù)的變化量小于預(yù)定門限,則從該第一視頻數(shù)據(jù)中提取教師畫面,并將當(dāng)前的錄播畫面切換為該教師畫面。
在本發(fā)明的優(yōu)選例中,本方法還包括以下步驟:
當(dāng)錄播畫面為教師畫面時(shí),如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻中,該第一視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)逐步減少為0,并且,
其中,分別為當(dāng)前幀畫面R矩陣、B矩陣、G矩陣中第i點(diǎn)色彩數(shù)值的大小,分別為當(dāng)n毫秒前的幀畫面R矩陣、B矩陣、G矩陣中第i點(diǎn)色彩數(shù)值的大小,N為整幅畫面的像素,σ為預(yù)先設(shè)定的第一閾值,
則將當(dāng)前的錄播畫面切換為學(xué)生區(qū)域的畫面。
在本發(fā)明的優(yōu)選例中,本方法還包括以下步驟:
當(dāng)錄播畫面為學(xué)生區(qū)域的畫面時(shí),
如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻中,該后一個(gè)時(shí)間的第二視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)比前一個(gè)時(shí)間的第一視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)的減少量大于預(yù)定的第二閾值時(shí),則將當(dāng)前的錄播畫面切換為該教師畫面。
在本發(fā)明的優(yōu)選例中,本方法還包括以下步驟:
當(dāng)錄播畫面為教師畫面時(shí),如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻中,該后一個(gè)時(shí)間的第一視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)比前一個(gè)時(shí)間的第一視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)的減少量大于預(yù)定的第三閾值時(shí),則將當(dāng)前的錄播畫面切換為黑板區(qū)域的畫面。
在本發(fā)明的優(yōu)選例中,本方法還包括以下步驟:
當(dāng)錄播畫面為黑板區(qū)域的畫面時(shí),
如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻中,該第一視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)大于預(yù)定的第二閾值時(shí),則將當(dāng)前的錄播畫面切換為該教師的畫面。
在本發(fā)明的優(yōu)選例中,本方法還包含:
進(jìn)行音頻采集;
對(duì)視頻和采集到的音頻進(jìn)行合成并同步。
在本發(fā)明的優(yōu)選例中,本方法還包含:
在該講臺(tái)區(qū)域放置拾音器,將該講臺(tái)區(qū)域的拾音器保持開(kāi)啟,
在該學(xué)生區(qū)域放置多個(gè)拾音器,每個(gè)拾音器預(yù)先設(shè)置有區(qū)域范圍坐標(biāo),
根據(jù)該發(fā)言學(xué)生臉部的中心位置,和該各拾音器的區(qū)域范圍坐標(biāo),確定該發(fā)言學(xué)生所在的區(qū)域范圍對(duì)應(yīng)的拾音器,并開(kāi)啟該拾音器。
在本發(fā)明的第二個(gè)方面,提供了一種具有智能切換功能的錄播系統(tǒng),包含:
起始錄播模塊,用于通過(guò)第一攝像機(jī)拍攝講臺(tái)區(qū)域的第一視頻數(shù)據(jù),同時(shí),通過(guò)第二攝像機(jī)拍攝學(xué)生區(qū)域的第二視頻數(shù)據(jù),并從該第一視頻數(shù)據(jù)中提取教師畫面,將當(dāng)前的錄播畫面切換為該教師畫面;
分析模塊,用于實(shí)時(shí)地對(duì)該第二視頻數(shù)據(jù)進(jìn)行圖像分析,獲得該第二視頻數(shù)據(jù)中的每一個(gè)臉部的中心位置對(duì)應(yīng)的水平坐標(biāo)值和垂直坐標(biāo)值,和像素點(diǎn)總數(shù);
切換模塊,用于當(dāng)在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻幀中,存在一個(gè)臉部的垂直坐標(biāo)值的變化量大于預(yù)定門限,且變化方向?yàn)橄蛏?,并且該臉部的像素點(diǎn)總數(shù)的變化量小于預(yù)定門限時(shí),確定該臉部為發(fā)言學(xué)生臉部,并從該第一視頻數(shù)據(jù)中提取教師畫面,從該第二視頻數(shù)據(jù)中提取該發(fā)言學(xué)生臉部畫面,并將當(dāng)前的錄播畫面切換為該教師畫面和該發(fā)言學(xué)生臉部畫面的組合。
本發(fā)明實(shí)施方式與現(xiàn)有技術(shù)相比,顯著提高了教育視頻錄播的效率。
應(yīng)理解,在本發(fā)明范圍內(nèi)中,本發(fā)明的上述各技術(shù)特征和在下文(如實(shí)施例)中具體描述的各技術(shù)特征之間都可以互相組合,從而構(gòu)成新的或優(yōu)選的技術(shù)方案。限于篇幅,在此不再一一累述。
附圖說(shuō)明
圖1示出了本發(fā)明的一個(gè)優(yōu)選例的具有智能切換功能的錄播系統(tǒng)的結(jié)構(gòu)圖;
圖2示出了本發(fā)明的課堂錄播設(shè)備配件布置示意圖;
圖3示出了本發(fā)明的具有智能切換功能的錄播方法中的主要場(chǎng)景的切換關(guān)系示意圖;
圖4示出了本發(fā)明的一個(gè)優(yōu)選例中對(duì)所拍攝的畫面的剪輯方式示意圖;
圖5示出了本發(fā)明的另一個(gè)優(yōu)選例中對(duì)說(shuō)拍攝的畫面的剪輯方式示意圖。
圖6示出了本發(fā)明的一個(gè)優(yōu)選例的具有智能切換功能的錄播方法的流程示意圖。
圖7示出了本發(fā)明的一個(gè)優(yōu)選例的具有智能切換功能的錄播系統(tǒng)的結(jié)構(gòu)示意圖。
在各附圖中,
101:視頻圖像采集模塊
102:圖像算法模塊
103:視頻采集模塊
104:音頻采集模塊
105:輸出模塊
701:起始錄播模塊
702:分析模塊
703:切換模塊
具體實(shí)施方式
本發(fā)明通過(guò)攝像裝置采集教師上課及學(xué)生聽(tīng)課的視頻,通過(guò)分析教師及學(xué)生的人體臉部坐標(biāo)位置及坐標(biāo)變化的趨勢(shì)以及臉部像素及RGB參數(shù)的變化,有效判斷師生的教學(xué)場(chǎng)景并對(duì)顯示的畫面進(jìn)行切換。并且,可以根據(jù)不同的教學(xué)場(chǎng)景以確定輸出圖像的剪輯方式。并且,還可以根據(jù)不同的教學(xué)場(chǎng)景控制音頻的拾取方式。
在以下的敘述中,為了使讀者更好地理解本申請(qǐng)而提出了許多技術(shù)細(xì)節(jié)。但是,本領(lǐng)域的普通技術(shù)人員可以理解,即使沒(méi)有這些技術(shù)細(xì)節(jié)和基于以下各實(shí)施方式的種種變化和修改,也可以實(shí)現(xiàn)本申請(qǐng)各權(quán)利要求所要求保護(hù)的技術(shù)方案。
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明的實(shí)施方式作進(jìn)一步地詳細(xì)描述。
在本發(fā)明中,四個(gè)主要場(chǎng)景分別是:
第一場(chǎng)景:老師在講臺(tái)上講課,學(xué)生在聽(tīng)講。顯示的畫面為老師電腦屏幕VGA信號(hào)為主畫面,拍攝講臺(tái)區(qū)域的第一攝像機(jī)為畫中小畫面。
第二場(chǎng)景:學(xué)生起立回答老師的問(wèn)題。拍攝講臺(tái)區(qū)域的第一攝像機(jī)為主畫面,拍攝學(xué)生區(qū)域的第二攝像機(jī)為畫中小畫面。
第三場(chǎng)景:老師走到講臺(tái)下與學(xué)生互動(dòng)。拍攝學(xué)生區(qū)域的第二攝像機(jī)為主畫面,不設(shè)小畫中小畫面。
第四場(chǎng)景:老師在黑板上寫板書。拍攝講臺(tái)區(qū)域的第一攝像機(jī)為主畫面,不設(shè)小畫中小畫面。
在本發(fā)明的優(yōu)選例中,課堂錄播設(shè)備配件布置如圖2所示,其中包含兩路攝像機(jī),攝像機(jī)A對(duì)著學(xué)生拍攝,攝像機(jī)B對(duì)著老師拍攝;包含5路拾音器,一路對(duì)著老師,四路均勻地分布在學(xué)生座位中間。
兩路攝像機(jī)的視頻數(shù)據(jù)經(jīng)過(guò)視頻采集卡傳輸?shù)街醒胫骺嘏_(tái),中央主控臺(tái)的作用為:接收視頻數(shù)據(jù),通過(guò)算法對(duì)視頻數(shù)據(jù)進(jìn)行分析,根據(jù)分析結(jié)果判斷教學(xué)場(chǎng)景,并根據(jù)不同的教學(xué)場(chǎng)景將相應(yīng)的控制信號(hào)發(fā)送到各路攝像機(jī)、混音器,并根據(jù)算法進(jìn)行導(dǎo)播,完成畫面的自動(dòng)切換,同時(shí),將播出的畫面存儲(chǔ)在中央主控臺(tái)的存儲(chǔ)裝置中。
下面參照?qǐng)D3,進(jìn)一步說(shuō)明第一場(chǎng)景的進(jìn)入和退出條件。如圖3所示,第一場(chǎng)景的進(jìn)入條件有兩個(gè),一個(gè)為開(kāi)機(jī)運(yùn)行,換句話說(shuō),開(kāi)機(jī)運(yùn)行即進(jìn)入第一場(chǎng)景。另一個(gè)進(jìn)入條件為滿足上述第二、第三和第四場(chǎng)景的退出條件時(shí),即進(jìn)入第一場(chǎng)景。另一方面,第一場(chǎng)景的推出條件為若滿足上述第二、第三和第四場(chǎng)景的進(jìn)入條件時(shí),即退出第一場(chǎng)景。
在本發(fā)明的優(yōu)選例中,兩路攝像機(jī)進(jìn)行圖像處理,經(jīng)過(guò)相關(guān)的圖像處理算法,判斷的結(jié)果為攝像機(jī)B,即采集講臺(tái)區(qū)域的攝像機(jī)捕捉到有人臉畫面,攝像機(jī)A,即采集學(xué)生區(qū)域的攝像機(jī)沒(méi)有捕捉到到人臉移動(dòng)的,此時(shí),算法判斷的教學(xué)場(chǎng)景為,教師在講臺(tái)上講課,學(xué)生在聽(tīng)講。算法計(jì)算出教師的臉部坐標(biāo)的中心值為(x,y),臉部所占的像素點(diǎn)總數(shù)為t。
中央處理器自動(dòng)剪輯所拍攝的畫面。
具體地說(shuō),在本發(fā)明的優(yōu)選例中,如圖4所示,對(duì)所拍攝的畫面的剪輯原則如下:
首先,調(diào)節(jié)截取拍攝的畫面的大小,保持原畫面的高寬比不變,臉部像素占畫面圖素的比例為a%;
然后,調(diào)節(jié)截取畫面的位置,臉部上邊緣距畫面上邊緣距離u1與臉部上邊緣距畫面下邊緣距離u2的比例為u,且臉部左邊緣距畫面左邊緣距離v1與臉部左邊緣距畫面右邊緣距離v2的比例為v。
進(jìn)一步地說(shuō),在本發(fā)明的優(yōu)選例中,u、v、a為可配置的參數(shù)。例如,取值范圍為0.1<u<0.3,0.1<v<0.3,0.2<a<0.6,單位是像素點(diǎn)數(shù)。
通過(guò)上述剪輯方式,保證了人像在畫面中位置及大小固定。
另外,如圖2所示,第一場(chǎng)景通過(guò)拾音器E獲取錄入音頻。
實(shí)施例1:第一場(chǎng)景與第二場(chǎng)景的切換方法
第一場(chǎng)景切換到第二場(chǎng)景
在本實(shí)施例中,包含以下步驟:
步驟601:通過(guò)第一攝像機(jī)拍攝講臺(tái)區(qū)域的第一視頻數(shù)據(jù),同時(shí),通過(guò)第二攝像機(jī)拍攝學(xué)生區(qū)域的第二視頻數(shù)據(jù),并從該第一視頻數(shù)據(jù)中提取教師畫面,將當(dāng)前的錄播畫面切換為該教師畫面;
步驟602:實(shí)時(shí)地對(duì)該第二視頻數(shù)據(jù)進(jìn)行圖像分析,獲得該第二視頻數(shù)據(jù)中的每一個(gè)臉部的中心位置對(duì)應(yīng)的水平坐標(biāo)值和垂直坐標(biāo)值,和像素點(diǎn)總數(shù);
步驟603:如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻幀中,存在一個(gè)臉部的垂直坐標(biāo)值的變化量大于預(yù)定門限,且變化方向?yàn)橄蛏希⑶以撃槻康南袼攸c(diǎn)總數(shù)的變化量小于預(yù)定門限,確定該臉部為發(fā)言學(xué)生臉部,并從該第一視頻數(shù)據(jù)中提取教師畫面,從該第二視頻數(shù)據(jù)中提取該發(fā)言學(xué)生臉部畫面,并將當(dāng)前的錄播畫面切換為該教師畫面和該發(fā)言學(xué)生臉部畫面的組合。
第二場(chǎng)景切換到第一場(chǎng)景
在本發(fā)明的一個(gè)優(yōu)選例中,當(dāng)錄播畫面為教師畫面和發(fā)言學(xué)生臉部畫面的組合狀態(tài)時(shí),如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻幀中,存在一個(gè)臉部的垂直坐標(biāo)值的變化量大于預(yù)定門限,且變化方向?yàn)橄蛳?,并且該臉部的像素點(diǎn)總數(shù)的變化量小于預(yù)定門限,則從所述第一視頻數(shù)據(jù)中提取教師畫面,并將當(dāng)前的錄播畫面切換為該教師畫面。
具體地說(shuō),在上述方法中,當(dāng)處于第一場(chǎng)景時(shí),攝像機(jī)A捕捉學(xué)生的畫面,并根據(jù)算法識(shí)別出所有學(xué)生的臉部,并計(jì)算出學(xué)生的臉部坐標(biāo)的中心值(α,β)及臉部所占的像素點(diǎn)總數(shù)為γ,且捕捉到的學(xué)生臉總數(shù)為n。學(xué)生臉部坐標(biāo)的集合為σ={(α1,β1),(α2,β2),…,(αn,βn)},臉部像素點(diǎn)總數(shù)的集合為γ={γ1,γ2,…,γ3}。
當(dāng)任何一個(gè)學(xué)生的臉部在垂直方向的移動(dòng)大于一定的幅度時(shí),可以用數(shù)學(xué)公式描述如下,攝像機(jī)中當(dāng)前幀與前一幀的集合相關(guān)集合分別為σ,γ,σ’,γ’,它們滿足以下條件時(shí),將進(jìn)入學(xué)生起立回答老師問(wèn)題的模式,即,第二場(chǎng)景。
或|βk-βk’|>b
或|γk-γk’|>γ
其中,k=1,2,…,n。
其中,a、b、γ為可配置的參數(shù),其具體參數(shù)值在本發(fā)明中不做限定。
其中,a、b、γ為可配置的參數(shù),在本發(fā)明的優(yōu)選例中,1080P像素的視頻中,a、b、γ可以取滿足以下條件的任意值,a>20,b>20,γ>20??梢岳斫猓谄渌麅?yōu)選例中,上述參數(shù)可以根據(jù)具體情況靈活調(diào)整。
如果滿足上述條件,則學(xué)生起立回答老師的問(wèn)題。在這種情況下,由第一場(chǎng)景對(duì)應(yīng)顯示的畫面切換到第二場(chǎng)景對(duì)應(yīng)顯示的畫面。
當(dāng)處于第二場(chǎng)景時(shí),如果起立的學(xué)生的臉部移動(dòng)大于一定的幅度時(shí),則退出第二場(chǎng)景??梢杂脭?shù)學(xué)公式描述為,
|αk’-αk”|>a’
或|βk’-βk”|>b’
其中,該學(xué)生的臉部中心坐標(biāo)值為(αk’,βk’),移動(dòng)后的學(xué)生的臉部中心坐標(biāo)值為(αk”,βk”)。
a’、b’為可配置的參數(shù),在本發(fā)明的優(yōu)選例中,a、b可以取滿足以下條件的任意值,a>20,b>20,單位是像素點(diǎn)數(shù)。
可以理解,在其他優(yōu)選例中,上述參數(shù)可以根據(jù)具體情況靈活調(diào)整。
在這種情況下,由第二場(chǎng)景對(duì)應(yīng)顯示的畫面切換到第一場(chǎng)景對(duì)應(yīng)顯示的畫面。
在本發(fā)明的優(yōu)選例中,當(dāng)判斷為第二場(chǎng)景時(shí),老師作為主畫面,將學(xué)生從學(xué)生攝像機(jī)中的畫面中截取出來(lái),與老師講課的主畫面組成畫中畫的形式,其中,老師畫面的截取參數(shù)u、v、a與第一場(chǎng)景的定義相同,但是其值大小可以單獨(dú)配置。
學(xué)生臉部畫面配置方式如下:
1.調(diào)節(jié)截取畫面的大小,畫面的像素的寬高值分別為a、b;
2.確定學(xué)生人臉在畫中畫的大小,人臉像素占畫中畫圖素的比例為a’%;
3.確定學(xué)生人臉在畫中畫的位置,人臉左邊緣距畫中畫左邊緣為a1個(gè)像素點(diǎn),人臉上邊緣距畫中畫上邊緣為b1個(gè)像素點(diǎn);
4.確定畫中畫在整個(gè)畫面的位置,畫中畫上邊緣距畫面上邊緣距離u1’與畫中畫上邊緣距畫面下邊緣距離u2’的比例為u’,且畫中畫左邊緣距畫面左邊緣距離v1’與畫中畫左邊緣距畫面右邊緣距離v2’的比例為v’。
在本發(fā)明的優(yōu)選例中,a、b、a’%、a1、b1、u1’、u2’、u’、v1’、v2’、v’均為可配置在參數(shù),可以根據(jù)具體情況靈活調(diào)整。
處于第二場(chǎng)景時(shí),講臺(tái)上的拾音器E一直開(kāi)啟,講臺(tái)下的拾音器開(kāi)啟由起立回答問(wèn)題的學(xué)生的具體位置決定。
具體地說(shuō),在本發(fā)明的優(yōu)選例中,學(xué)生的臉中心位置的坐標(biāo)(αk,βk)滿足以下條件時(shí),拾音器A開(kāi)啟:
Ax1<αk<Ax2;
Ay1<βk<Ay2;
其中,Ax1、Ax2、Ay1、Ay2為可配置的量。
同理,當(dāng)滿足以下條件時(shí),拾音器B開(kāi)啟:
Bx1<αk<Bx2;
By1<βk<By2;
同理可以設(shè)定拾音器C、D的開(kāi)啟條件。
實(shí)施例2:第一場(chǎng)景與第三場(chǎng)景的切換方法
第一場(chǎng)景切換到第三場(chǎng)景
在本實(shí)施例中,包含以下步驟:
當(dāng)錄播畫面為教師畫面時(shí),如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻中,該第一視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)逐步減少為0,并且,
其中,分別為當(dāng)前幀畫面R矩陣、B矩陣、G矩陣中第i點(diǎn)色彩數(shù)值的大小,分別為當(dāng)n毫秒前的幀畫面R矩陣、B矩陣、G矩陣中第i點(diǎn)色彩數(shù)值的大小,N為整幅畫面的像素,σ為預(yù)先設(shè)定的第一閾值,
則將當(dāng)前的錄播畫面切換為學(xué)生區(qū)域的畫面。
第三場(chǎng)景切換到第一場(chǎng)景
當(dāng)錄播畫面為學(xué)生區(qū)域的畫面時(shí),
如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻中,所述后一個(gè)時(shí)間的第二視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)比前一個(gè)時(shí)間的第一視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)的減少量大于預(yù)定的第二閾值時(shí),則將當(dāng)前的錄播畫面切換為該教師畫面。
具體地說(shuō),在上述方法中,當(dāng)處于第一場(chǎng)景時(shí),攝像機(jī)B,即采集講臺(tái)區(qū)域的攝像機(jī)滿足如下條件時(shí),是老師走下講臺(tái)與學(xué)生互動(dòng),換句話說(shuō),由第一場(chǎng)景切換到第三場(chǎng)景:
1.攝像機(jī)B當(dāng)畫面幀臉部像素點(diǎn)總數(shù)為t1,與1秒鐘之前的畫面幀面像素點(diǎn)總數(shù)為t2,
t2<t1;
2.攝像機(jī)B畫面經(jīng)過(guò)若干幀后,t2變?yōu)?。
3.攝像機(jī)A,即采集學(xué)生區(qū)域的攝像機(jī)捕捉到的當(dāng)前畫面與n毫秒前捕捉到的畫面RBG矩陣數(shù)值變化量之和大于某一值σ,其中n、σ可以根據(jù)具體情況靈活調(diào)整:
其中,分別為當(dāng)前幀畫面R矩陣、B矩陣、G矩陣中第i點(diǎn)色彩數(shù)值的大小,分別為當(dāng)n毫秒前的幀畫面R矩陣、B矩陣、G矩陣中第i點(diǎn)色彩數(shù)值的大小,N為整幅畫面的像素。
在這種情況下,由第一場(chǎng)景對(duì)應(yīng)顯示的畫面切換到第三場(chǎng)景對(duì)應(yīng)顯示的畫面。
當(dāng)攝像機(jī)B再次采集到人臉時(shí),即本次互動(dòng)結(jié)束,退出第三場(chǎng)景。在這種情況下,由第三場(chǎng)景對(duì)應(yīng)顯示的畫面切換到第一場(chǎng)景對(duì)應(yīng)顯示的畫面。
實(shí)施例3:第一場(chǎng)景與第四場(chǎng)景的切換方法
第一場(chǎng)景切換到第四場(chǎng)景
在本實(shí)施例中,包含以下步驟:
當(dāng)錄播畫面為教師畫面時(shí),如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻中,該后一個(gè)時(shí)間的第一視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)比前一個(gè)時(shí)間的第一視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)的減少量大于預(yù)定的第三閾值時(shí),則將當(dāng)前的錄播畫面切換為黑板區(qū)域的畫面。
第四場(chǎng)景切換到第一場(chǎng)景
當(dāng)錄播畫面為黑板區(qū)域的畫面時(shí),
如果在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻中,該第一視頻數(shù)據(jù)中臉部的像素點(diǎn)總數(shù)大于預(yù)定的第二閾值時(shí),則將當(dāng)前的錄播畫面切換為該教師的畫面。
具體地說(shuō),在上述方法中,當(dāng)處于第一場(chǎng)景時(shí),攝像機(jī)B畫面幀臉部的中心位置坐標(biāo)為(x1,y1),像素點(diǎn)總數(shù)為t1,此時(shí)如果教師開(kāi)始轉(zhuǎn)身在黑板上板書,則經(jīng)過(guò)圖像處理算法,與1秒鐘之前的畫面幀對(duì)比,臉部的中心位置坐標(biāo)為(x2,y2),像素點(diǎn)總數(shù)為t2,由于開(kāi)始轉(zhuǎn)身,導(dǎo)致其臉部所占的像素是逐步減小??梢杂霉竭M(jìn)行關(guān)系式如下描述:
|x1-x2|<δx;
且|y1-y2|<δy;
且t2-t1>ε
其中,δx、δy、ε為可配置的參數(shù),在本發(fā)明的優(yōu)選例中,δx、δy、ε可以取滿足以下條件的值:δx<50,δy<50,ε>20,單位是像素點(diǎn)數(shù)??梢岳斫猓谄渌麅?yōu)選例中,上述參數(shù)可以根據(jù)具體情況靈活調(diào)整。
在這種情況下,由第一場(chǎng)景對(duì)應(yīng)顯示的畫面切換到第四場(chǎng)景對(duì)應(yīng)顯示的畫面。
當(dāng)前處于第四場(chǎng)景時(shí),攝像機(jī)B畫面幀臉部的中心位置坐標(biāo)為(x1’,y1’),像素點(diǎn)總數(shù)為t1’,當(dāng)教師由面向黑板轉(zhuǎn)身面向?qū)W生區(qū)域時(shí),與1秒鐘之前的畫面幀對(duì)比,臉部的中心位置坐標(biāo)為(x2’,y2’),像素點(diǎn)總數(shù)為t2’,教師由于轉(zhuǎn)身,導(dǎo)致其臉部所占的像素是逐步增大。可以用公式進(jìn)行關(guān)系式如下描述:
|x1’-x2’|<δx’;
且|y1’-y2’|<δy’;
且t2’-t1’>ε’
其中,δx’、δy’、ε’為可配置的參數(shù),在本發(fā)明的優(yōu)選例中,δx’、δy’、ε’可以取滿足以下條件的值:δx’<50,δy’<50,ε’<50,單位是像素點(diǎn)數(shù)。可以理解,在其他優(yōu)選例中,上述參數(shù)可以根據(jù)具體情況靈活調(diào)整。
在這種情況下,由第四場(chǎng)景對(duì)應(yīng)顯示的畫面切換到第一場(chǎng)景對(duì)應(yīng)顯示的畫面。
在本發(fā)明的優(yōu)選例中,算法模塊判斷進(jìn)入第四場(chǎng)景,即,老師在黑板上寫板書。第四場(chǎng)景的視頻處理顯示模式與第一場(chǎng)景相同,僅視頻的尺寸參數(shù)不同。相應(yīng)的參數(shù)進(jìn)行重新設(shè)置,第二場(chǎng)景的顯示畫面中的參數(shù)設(shè)定為u’、v’、a’。
第四場(chǎng)景的音頻處理過(guò)程:第四場(chǎng)景由拾音器E獲取錄入音頻。
需要指出的是,在本發(fā)明的優(yōu)選例中,將所述教師區(qū)域的拾音器保持開(kāi)啟,并且在所述學(xué)生區(qū)域分開(kāi)地放置了第一至第四拾音器,學(xué)生臉部中心坐標(biāo)為(x,y),當(dāng)(x,y)滿足不同的條件時(shí),系統(tǒng)開(kāi)啟不同的拾音器,具體地說(shuō):
當(dāng)Ax1<x<Ax2,Ay1<x<Ay2時(shí),開(kāi)啟第一拾音器;
當(dāng)Bx1<x<Bx2,By1<x<By2時(shí),開(kāi)啟第二拾音器;
……
依次類推。
由此,通過(guò)在不同區(qū)域放置拾音器,提高了聲音錄制的質(zhì)量和效果。
對(duì)于上述實(shí)施例1、2和3,可以通過(guò)如圖1所示的錄播系統(tǒng)實(shí)現(xiàn),如圖所述,該系統(tǒng)包含視頻圖像采集模塊101、圖像算法模塊102、視頻剪輯模塊103、音頻采集模塊104和輸出模塊105。
視頻圖像采集模塊101,用于采集老師側(cè)及老師側(cè)多路視頻數(shù)據(jù),并將視頻數(shù)據(jù)傳輸?shù)街醒胫骺嘏_(tái)。在本發(fā)明的優(yōu)選例中,視頻采集的路數(shù),即攝像機(jī)數(shù)量可以根據(jù)實(shí)際需要進(jìn)行調(diào)整。
圖像算法模塊102,位于中央主控臺(tái),用于分析及處理視頻圖像,根據(jù)輸入的圖像判斷出人體坐標(biāo)及人臉?biāo)嫉南袼財(cái)?shù),根據(jù)前后幀的人體坐標(biāo)及像素?cái)?shù)的變化趨勢(shì)可以判斷出人的動(dòng)態(tài),并得到相對(duì)應(yīng)的教學(xué)場(chǎng)景。如老師轉(zhuǎn)身寫黑板的動(dòng)作、學(xué)生站立的動(dòng)作、老師走下講臺(tái)的動(dòng)作,通過(guò)動(dòng)作對(duì)應(yīng)到相應(yīng)的教學(xué)場(chǎng)景,再通過(guò)教學(xué)場(chǎng)景確定圖像剪輯輸出的方式及選取拾音的麥克風(fēng)。
視頻剪輯模塊103,根據(jù)不同的教學(xué)場(chǎng)景對(duì)輸出的多路鏡頭自動(dòng)進(jìn)行剪輯及其它相應(yīng)的視頻處理,并輸出最終錄播的視頻。
音頻采集模塊104,根據(jù)教學(xué)場(chǎng)景及人體的定位,確定并選取錄入視頻的拾音器。
輸出模塊105,將音頻與視頻合成并同步后,輸出到顯示裝置和存儲(chǔ)裝置中。
實(shí)施例4:具有智能切換功能的錄播系統(tǒng)
參見(jiàn)圖7,根據(jù)本發(fā)明的一個(gè)實(shí)施例的具有智能切換功能的錄播系統(tǒng)包含:起始錄播模塊701、分析模塊702和切換模塊703。
具體地說(shuō),起始錄播模塊701用于通過(guò)第一攝像機(jī)拍攝講臺(tái)區(qū)域的第一視頻數(shù)據(jù),同時(shí),通過(guò)第二攝像機(jī)拍攝學(xué)生區(qū)域的第二視頻數(shù)據(jù),并從所述第一視頻數(shù)據(jù)中提取教師畫面,將當(dāng)前的錄播畫面切換為該教師畫面。分析模塊702用于實(shí)時(shí)地對(duì)所述第二視頻數(shù)據(jù)進(jìn)行圖像分析,獲得所述第二視頻數(shù)據(jù)中的每一個(gè)臉部的中心位置對(duì)應(yīng)的水平坐標(biāo)值和垂直坐標(biāo)值,和像素點(diǎn)總數(shù)。切換模塊703,用于當(dāng)在相隔預(yù)定時(shí)長(zhǎng)的兩個(gè)視頻幀中,存在一個(gè)臉部的垂直坐標(biāo)值的變化量大于預(yù)定門限,且變化方向?yàn)橄蛏希⑶以撃槻康南袼攸c(diǎn)總數(shù)的變化量小于預(yù)定門限時(shí),確定該臉部為發(fā)言學(xué)生臉部,并從所述第一視頻數(shù)據(jù)中提取教師畫面,從所述第二視頻數(shù)據(jù)中提取該發(fā)言學(xué)生臉部畫面,并將當(dāng)前的錄播畫面切換為該教師畫面和該發(fā)言學(xué)生臉部畫面的組合。
上述實(shí)施方式1-3是與本實(shí)施方式相對(duì)應(yīng)的方法實(shí)施方式,本實(shí)施方式可與上述實(shí)施方式互相配合實(shí)施。上述實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)在本實(shí)施方式中依然有效,為了減少重復(fù),這里不再贅述。相應(yīng)地,本實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)也可應(yīng)用在上述實(shí)施方式中。
本發(fā)明的主要優(yōu)點(diǎn)包括:
1)免去了后期人工復(fù)雜的制作、剪切、編輯,可以實(shí)現(xiàn)自動(dòng)導(dǎo)播、自動(dòng)跟拍、自動(dòng)剪輯功能,錄制出滿足國(guó)家教育部規(guī)定的國(guó)家精品開(kāi)放課程要求數(shù)學(xué)教學(xué)資源。
2)錄制時(shí)不需要人工導(dǎo)播即可以實(shí)現(xiàn)導(dǎo)播切換鏡頭的功能,節(jié)省大量的人力成本。
3)在不增加硬件的基礎(chǔ)上,實(shí)現(xiàn)自動(dòng)導(dǎo)播、自動(dòng)跟拍、自動(dòng)剪輯功能,降低成本,能促進(jìn)產(chǎn)品的推廣。
綜上所述,本發(fā)明提供的具有智能切換功能的錄播方法顯著提高了效率,因此,在教育錄播技術(shù)領(lǐng)域有十分廣闊的應(yīng)用前景。
本發(fā)明的各方法實(shí)施方式均可以以軟件、硬件、固件等方式實(shí)現(xiàn)。不管本發(fā)明是以軟件、硬件、還是固件方式實(shí)現(xiàn),指令代碼都可以存儲(chǔ)在任何類型的計(jì)算機(jī)可訪問(wèn)的存儲(chǔ)器中(例如永久的或者可修改的,易失性的或者非易失性的,固態(tài)的或者非固態(tài)的,固定的或者可更換的介質(zhì)等等)。同樣,存儲(chǔ)器可以例如是可編程陣列邏輯(Programmable Array Logic,簡(jiǎn)稱“PAL”)、隨機(jī)存取存儲(chǔ)器(Random Access Memory,簡(jiǎn)稱“RAM”)、可編程只讀存儲(chǔ)器(Programmable Read Only Memory,簡(jiǎn)稱“PROM”)、只讀存儲(chǔ)器(Read-Only Memory,簡(jiǎn)稱“ROM”)、電可擦除可編程只讀存儲(chǔ)器(Electrically Erasable Programmable ROM,簡(jiǎn)稱“EEPROM”)、磁盤、光盤、數(shù)字通用光盤(Digital Versatile Disc,簡(jiǎn)稱“DVD”)等等。
需要說(shuō)明的是,本發(fā)明各設(shè)備實(shí)施方式中提到的各單元都是邏輯單元,在物理上,一個(gè)邏輯單元可以是一個(gè)物理單元,也可以是一個(gè)物理單元的一部分,還可以以多個(gè)物理單元的組合實(shí)現(xiàn),這些邏輯單元本身的物理實(shí)現(xiàn)方式并不是最重要的,這些邏輯單元所實(shí)現(xiàn)的功能的組合才是解決本發(fā)明所提出的技術(shù)問(wèn)題的關(guān)鍵。此外,為了突出本發(fā)明的創(chuàng)新部分,本發(fā)明上述各設(shè)備實(shí)施方式并沒(méi)有將與解決本發(fā)明所提出的技術(shù)問(wèn)題關(guān)系不太密切的單元引入,這并不表明上述設(shè)備實(shí)施方式并不存在其它的單元。
需要說(shuō)明的是,在本發(fā)明提及的所有文獻(xiàn)都在本申請(qǐng)中引用作為參考,就如同每一篇文獻(xiàn)被單獨(dú)引用作為參考那樣。此外應(yīng)理解,在閱讀了本發(fā)明的上述講授內(nèi)容之后,本領(lǐng)域技術(shù)人員可以對(duì)本發(fā)明作各種改動(dòng)或修改,這些等價(jià)形式同樣落于本申請(qǐng)所附權(quán)利要求書所限定的范圍。
并且,在本專利的權(quán)利要求書和說(shuō)明書中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。本專利的權(quán)利要求書和說(shuō)明書中,如果提到根據(jù)某要素執(zhí)行某行為,則是指至少根據(jù)該要素執(zhí)行該行為的意思,其中包括了兩種情況:僅根據(jù)該要素執(zhí)行該行為、和根據(jù)該要素和其它要素執(zhí)行該行為。
雖然通過(guò)參照本發(fā)明的某些優(yōu)選實(shí)施例,已經(jīng)對(duì)本發(fā)明進(jìn)行了圖示和描述,但本領(lǐng)域的普通技術(shù)人員應(yīng)該明白,可以在形式上和細(xì)節(jié)上對(duì)其作各種改變,而不偏離本發(fā)明的精神和范圍。