時間:2023-05-30 14:44:54
序論:在您撰寫數(shù)據(jù)分析論文時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。
將醫(yī)院、醫(yī)療保健組織等數(shù)字化的醫(yī)療數(shù)據(jù)以特定的格式、協(xié)議發(fā)送到醫(yī)療數(shù)據(jù)分析模塊進(jìn)行分析與疾病預(yù)測.醫(yī)療數(shù)據(jù)提取模塊:該模塊由醫(yī)院電子病歷系統(tǒng)負(fù)責(zé)實(shí)現(xiàn),我們使用openEHR系統(tǒng)作為醫(yī)院電子病歷系統(tǒng),并在openEHR中實(shí)現(xiàn)醫(yī)療數(shù)據(jù)的提取功能.openEHR系統(tǒng)是一個開源、靈活的電子病歷系統(tǒng),支持HL7衛(wèi)生信息交換標(biāo)準(zhǔn).很多醫(yī)療健康組織、政府和學(xué)術(shù)科研單位都使用openEHR進(jìn)行開發(fā)和科研工作.如一種基于openEHR的患者病歷數(shù)據(jù)管理模型、openEHR等許多開源的電子病歷平臺的對比與評估和基于openEHR的檔案建模等.?dāng)?shù)據(jù)交換模塊:基于Web服務(wù)的數(shù)據(jù)交換模塊使用醫(yī)療數(shù)據(jù)通信協(xié)議實(shí)現(xiàn)醫(yī)療數(shù)據(jù)分析模塊與醫(yī)療數(shù)據(jù)提取模塊的數(shù)據(jù)交換.Web服務(wù)是一個平立、松耦合的Web應(yīng)用程序.由于Web服務(wù)的跨平臺特性,許多模型與框架是基于Web服務(wù)構(gòu)建的,如基于Web服務(wù)集成分布式資源和數(shù)據(jù)流分析測試等.在本文提出的醫(yī)療數(shù)據(jù)分析模型中,使用Web服務(wù)來連接醫(yī)療數(shù)據(jù)分析模塊和醫(yī)療數(shù)據(jù)提取模塊.醫(yī)療數(shù)據(jù)提取模塊作為Web服務(wù)的服務(wù)端,實(shí)現(xiàn)的方法包括存取數(shù)據(jù)、數(shù)據(jù)預(yù)處理、序列化等,改進(jìn)后的模型要求實(shí)現(xiàn)指定維度,指定屬性數(shù)據(jù)的讀取.本文提出的醫(yī)療數(shù)據(jù)分析模塊作為Web服務(wù)的客戶端,通過HTTP服務(wù)向數(shù)據(jù)提取模塊請求獲取數(shù)據(jù),并對數(shù)據(jù)進(jìn)行預(yù)處理.醫(yī)療數(shù)據(jù)分析模塊:我們使用Caisis開源平臺作為醫(yī)療數(shù)據(jù)分析與疾病預(yù)測系統(tǒng)實(shí)現(xiàn)這一模塊.Caisis是基于Web的開源癌癥數(shù)據(jù)管理系統(tǒng),一些臨床醫(yī)學(xué)研究使用Caisis系統(tǒng)管理和歸檔數(shù)字顯微圖像,通過向Caisis系統(tǒng)中添加特征選擇和SVM算法,使用SVM算法對醫(yī)療數(shù)據(jù)進(jìn)行分析和疾病預(yù)測,因此使用的特征選擇算法需要基于SVM,可以提高數(shù)據(jù)分析和疾病預(yù)測過程的效率和準(zhǔn)確度.
2數(shù)據(jù)分析模塊與算法
2.1SVM算法SVM算法最初是由Vapnik等人在1995年提出的一種可訓(xùn)練的機(jī)器學(xué)習(xí)算法.依據(jù)統(tǒng)計(jì)學(xué)習(xí)理論、VC維理論和結(jié)構(gòu)風(fēng)險最小化理論,從一定數(shù)目的樣本信息在學(xué)習(xí)能力和復(fù)雜度(對訓(xùn)練樣本的學(xué)習(xí)程度)中找到最佳折中,以期望獲得最好的推廣能力(或稱泛化能力).
2.2基于SVM的醫(yī)療數(shù)據(jù)分析模塊將SVM分類算法應(yīng)用到醫(yī)療數(shù)據(jù)分析模塊中,進(jìn)行疾病預(yù)測.基于SVM的醫(yī)療數(shù)據(jù)分析模塊,通過數(shù)據(jù)交換模塊獲取原始組數(shù)據(jù)(患病病人醫(yī)療數(shù)據(jù)和對照組病人數(shù)據(jù)).通過特征選擇過程輸入到SVM分類器中進(jìn)行訓(xùn)練,訓(xùn)練后可以對新的醫(yī)療數(shù)據(jù)進(jìn)行分析預(yù)測.
3改進(jìn)的醫(yī)療數(shù)據(jù)交換模塊
3.1醫(yī)療數(shù)據(jù)交換模塊在原始的醫(yī)療數(shù)據(jù)交換模塊中,數(shù)據(jù)請求原語只由4條通信原語組成.由原始醫(yī)療數(shù)據(jù)分析模型的3個模塊構(gòu)建,其中在醫(yī)療數(shù)據(jù)分析模塊與醫(yī)療數(shù)據(jù)提取模塊之間的4條通信原語包括2條請求和2條應(yīng)答.由于醫(yī)療數(shù)據(jù)的維度極大,屬性很多,但是在預(yù)測某個疾病時,只有很少的一部分屬性會對分類預(yù)測產(chǎn)生影響.這樣的全部維度的數(shù)據(jù)都需要傳輸,浪費(fèi)了時間,降低了數(shù)據(jù)傳輸效率,影響了醫(yī)療數(shù)據(jù)分析模塊的算法效率.
3.2改進(jìn)的醫(yī)療數(shù)據(jù)交換模塊在改進(jìn)的醫(yī)療數(shù)據(jù)交換模塊中,在數(shù)據(jù)傳輸協(xié)議中增加了4條原語.在每條原語中不僅有醫(yī)療記錄條數(shù)的要求,還包括對所請求醫(yī)療數(shù)據(jù)維度和屬性的具體說明.醫(yī)療數(shù)據(jù)分析模塊先請求一小部分全部維度的數(shù)據(jù),對這小部分?jǐn)?shù)據(jù)進(jìn)行特征選擇.然后醫(yī)療數(shù)據(jù)分析模塊只請求特征選擇出來的對預(yù)測相關(guān)的屬性的剩余所有醫(yī)療數(shù)據(jù).最后通過SVM分類算法進(jìn)行訓(xùn)練和預(yù)測.在新的醫(yī)療數(shù)據(jù)交換模塊中,大部分?jǐn)?shù)據(jù)中只有小部分相關(guān)屬性被傳輸?shù)綌?shù)據(jù)分析模塊,極大地減少了數(shù)據(jù)傳輸總量,也同時增加了分析模塊預(yù)測算法的效率.
4原始模型與改進(jìn)模型的對比結(jié)果
對于使用數(shù)據(jù)的動機(jī),除了對數(shù)據(jù)對象主體的認(rèn)知識別之外,還有要對數(shù)據(jù)呈現(xiàn)的顯性和隱性規(guī)律進(jìn)行發(fā)現(xiàn),從自然語言上看,腦力活動對數(shù)據(jù)處理的第一步就是降低數(shù)據(jù)間的差異化,進(jìn)行熵減的分析行為。哲學(xué)家維特根斯坦認(rèn)為,對于哲學(xué)本質(zhì)的界定都屬無法言說之物,應(yīng)用到數(shù)據(jù)分析領(lǐng)域,數(shù)據(jù)存在一種由內(nèi)而外的泛化慣性,不斷對原有數(shù)據(jù)形成新的描述,造成數(shù)據(jù)陣營的擴(kuò)張,而其信息主體則是穩(wěn)定的,對描述性數(shù)據(jù)和活動數(shù)據(jù)存在吸附力,屬于無法言說的本質(zhì)最邊緣。立足于這種思想觀點(diǎn),我們可以認(rèn)為貌似松散無序的數(shù)據(jù)間存在一種牢固的血緣數(shù)據(jù)關(guān)系,因?yàn)樗袛?shù)據(jù)都是基于信息主體泛化出的描述性和活動性數(shù)據(jù),而這種熵減的動作其表現(xiàn)形式可以等同于對數(shù)據(jù)血緣關(guān)系的向上追溯,技術(shù)上則表現(xiàn)為一種尋找最大扇出的上層。這樣,熵減的技術(shù)實(shí)現(xiàn)就是通過建立血緣關(guān)系而去尋找最大扇出的上層,這種分析法易于在數(shù)據(jù)發(fā)現(xiàn)應(yīng)用中,通過檢索建立模糊入口點(diǎn)去組織發(fā)現(xiàn)數(shù)據(jù),其與扇出或扇入點(diǎn)的血緣關(guān)系越近,入口點(diǎn)對其的吸附力越強(qiáng)、權(quán)重越高。但這樣會出現(xiàn)另一個無法回避的問題,即通過活動在最外界的數(shù)據(jù)從體量上看相當(dāng)可觀,由外到內(nèi)追溯扇出上層的勞動比較沉重,從而會理所當(dāng)然地采取抽樣的方式進(jìn)行,此項(xiàng)活動的進(jìn)行必須假定數(shù)據(jù)世界觀上層的有限集合認(rèn)定上,堅(jiān)信必定會將血緣關(guān)系歸集到某幾個關(guān)鍵數(shù)據(jù)表達(dá)之上,這樣才會使本項(xiàng)活動的實(shí)施行為具備基本的意義和價值。從效果上看,對數(shù)據(jù)進(jìn)行熵減有利于我們甄別數(shù)據(jù)關(guān)系隱含的內(nèi)在規(guī)律,也有利于我們建立具有良好適應(yīng)性的數(shù)據(jù)生態(tài)模型,為更好地認(rèn)識和利用數(shù)據(jù)打下基礎(chǔ)??梢院侠頃诚胍幌?,當(dāng)我們就一個焦點(diǎn)議題開展討論后,熵減讓我們迅速聚焦到議題的內(nèi)核,甚至直面議題背后隱含的現(xiàn)象實(shí)質(zhì),不必糾纏于不必要的信息干擾,對討論內(nèi)核進(jìn)行強(qiáng)化呈現(xiàn),智力活動所崇尚的方式也可以在計(jì)算活動中得以體現(xiàn)。熵減在某種意義上不是對某一類數(shù)據(jù)分析所采取的手段,而是對數(shù)據(jù)認(rèn)識的宏觀行為,其在計(jì)算領(lǐng)域內(nèi)的呈現(xiàn)方式,與我們對事物自然認(rèn)知而采取的抽象和引申別無二致,如此深入下來,對熵減策略的研究更重要于對熵減活動的歸納,通過對策略模型的推演,可以有效地發(fā)揮機(jī)器學(xué)習(xí)的能力,如果在策略模型的研究上實(shí)施開展,將會極大降低加工難度。
2建立標(biāo)簽關(guān)系的反向工程
當(dāng)我們框定了熵減的方法體系后,在數(shù)據(jù)間建立血緣關(guān)系則顯得尤為重要,由于數(shù)據(jù)生長動力呈現(xiàn)由內(nèi)而外的泛化驅(qū)動,但是本身這種泛化在信息化過程中很多是無組織的行為,缺少邏輯上預(yù)先定義,所以數(shù)據(jù)生成后,大量的數(shù)據(jù)關(guān)系被衰減掉,從正向渠道難以對數(shù)據(jù)關(guān)系建立血緣,工程極其浩瀚復(fù)雜。由于血緣關(guān)系無法完全在數(shù)據(jù)生長中自然形成,正向人工干預(yù)又存在操作難度,所以反其道而行之則是唯一通道。數(shù)據(jù)加工的反向性,優(yōu)勢首先體現(xiàn)在由微觀到宏觀的加工難度大幅下降,因?yàn)槠涔ぷ魈幱诔橄蟮淖畹讓?,使采用眾包模式加工成為可能。其次,這種加工模式,可以在有效建立一種數(shù)據(jù)關(guān)系的閉環(huán)管理的同時,不會抑制數(shù)據(jù)生長的空間和速率,不會因加工效率低而凝固數(shù)據(jù)資產(chǎn)化的進(jìn)程。在反向加工的過程中,需要通過標(biāo)簽聯(lián)結(jié)數(shù)據(jù)關(guān)系,這時候我們要關(guān)注標(biāo)簽的質(zhì)量和復(fù)用度,由于標(biāo)簽定義存在難度,所以要松綁標(biāo)簽定義來促成數(shù)據(jù)加工的快速實(shí)施,解決的重點(diǎn)則遷移到標(biāo)簽在后期管理中的智能化上。首先,可以通過標(biāo)簽在關(guān)系聯(lián)結(jié)中的重復(fù)出現(xiàn)進(jìn)行跟蹤,識別是標(biāo)簽二義性還是加工者的活動差異?;顒硬町悩?biāo)簽最基本的處理方法是進(jìn)行聚合,形成知識歸納;二義標(biāo)簽則需要改進(jìn)表達(dá)。其次,依賴血緣關(guān)系建立可視化圖譜,從數(shù)據(jù)結(jié)構(gòu)工程里可以有效識別關(guān)系路徑的黏合點(diǎn),即發(fā)現(xiàn)重復(fù)路徑中出現(xiàn)的一個以上的標(biāo)簽,消除由知識結(jié)構(gòu)差異造成的人為誤會,對標(biāo)簽進(jìn)行合并。這樣,通過標(biāo)簽的智能化后期管理就可以將加工難度上移,建立分層加工的工廠模式。這種加工存在基本準(zhǔn)則,并要建立基本的衡量尺度來保證標(biāo)簽有效性,加工工藝可以從標(biāo)簽質(zhì)量、使用度、命中率等指標(biāo)進(jìn)行測量。其中,質(zhì)量有賴于標(biāo)簽本身定義成分的內(nèi)涵,要確認(rèn)其被受眾廣泛理解;使用度是在加工活動中的使用次數(shù),是否被數(shù)據(jù)關(guān)系廣泛應(yīng)用,使用度較低的標(biāo)簽要確認(rèn)其存在價值,通過標(biāo)簽間同時出現(xiàn)概率決定其含義表達(dá)是否具備唯一性;命中率則建立在使用者的自然需要基礎(chǔ)上,如果某一標(biāo)簽絕少被使用者利用或調(diào)度,與整體觀測結(jié)果是否存在數(shù)值上的明顯差異。整體上看,通過這些基本準(zhǔn)則建立標(biāo)簽管理的異常檢測分析,來保證加工質(zhì)量的方式具備技術(shù)的可行性,但同時更需要對后期的數(shù)據(jù)運(yùn)行建立領(lǐng)域指標(biāo)模型來校驗(yàn)。
3利用詞條原子化推導(dǎo)入口點(diǎn)
1.1資料來源
AEFI數(shù)據(jù)來源于中國疑似預(yù)防接種信息管理系統(tǒng)。疫苗接種數(shù)據(jù)來源于中國免疫規(guī)劃信息管理系統(tǒng)。1.2統(tǒng)計(jì)方法采用描述性流行病學(xué)方法,運(yùn)用EXCEL2007進(jìn)行統(tǒng)計(jì)分析。
2結(jié)果
2.1地區(qū)分布
2013年鞍山市共報(bào)告AEFI189例,與2012年相比(35例)上升了440%。縣級AEFI報(bào)告覆蓋率100%。各縣(市、區(qū))AEFI報(bào)告數(shù)與2012年相比上升了55.56%~4200%。
2.2年齡與性別分布
男女性別比為1.49:1。報(bào)告例數(shù)排前位的年齡組分別是0歲組(101例,占53.44%)、1歲組(51例,占26.98%)、6歲組(23例,占12.17%)。
2.3疫苗和劑次分布
AEFI涉及的疫苗排前位的分別是:百白破疫苗(70例,占37.04%)、麻風(fēng)疫苗(36例,19.05%)、白破疫苗(23例,12.17%)。接種疫苗第1劑次發(fā)生AEFI128例,占67.73%;第2劑次18例,占9.52%;第3劑次17例,占8.99%;第4劑次26例,占13.76%。以疫苗單劑次統(tǒng)計(jì),AEFI涉及的疫苗排前位的分別是麻風(fēng)疫苗(36例)、第4劑次百白破疫苗(25例)、白破疫苗(23例)、第1劑次百白破疫苗(22例)。
2.4報(bào)告發(fā)生率
根據(jù)國家免疫規(guī)劃疫苗接種率監(jiān)測報(bào)告數(shù)據(jù)估算,2013年我市AEFI報(bào)告發(fā)生率為32.27/10萬劑次。國家免疫規(guī)劃各疫苗AEFI報(bào)告發(fā)生率波動在3.82/10萬劑次~125.28/10萬劑次。報(bào)告發(fā)生率居前位的分別為:麻風(fēng)疫苗125.28/10萬劑次,白破疫苗84.57/10萬劑次,百白破疫苗65.17/10萬劑次。
3討論
「關(guān)鍵詞人口遷移/戶籍制度/市場化改革
改革以來中國發(fā)生的大規(guī)模人口遷移,是制度變遷和經(jīng)濟(jì)轉(zhuǎn)型共同作用的結(jié)果。中國傳統(tǒng)的計(jì)劃經(jīng)濟(jì)體制是圍繞推行重工業(yè)優(yōu)先發(fā)展戰(zhàn)略而形成的。在資本稀缺的經(jīng)濟(jì)中,推行資本密集型重工業(yè)優(yōu)先發(fā)展戰(zhàn)略,不可能依靠市場來引導(dǎo)資源配置,因而必須通過計(jì)劃分配的機(jī)制把各種資源按照產(chǎn)業(yè)發(fā)展的優(yōu)先序進(jìn)行配置。由此,以資本和勞動力為代表的資源或生產(chǎn)要素,既無必要,也不允許根據(jù)市場價格信號自由流動,因此,隨著20世紀(jì)50年代這種發(fā)展戰(zhàn)略格局的確定,一系列相關(guān)制度安排把資本和勞動力的配置,按照地域、產(chǎn)業(yè)、所有制等分類人為地“畫地為牢”,計(jì)劃之外的生產(chǎn)要素流動成為不合法的現(xiàn)象。其中把城鄉(xiāng)人口和勞動力分隔開的戶籍制度,以及與其配套的城市勞動就業(yè)制度、城市偏向的社會保障制度、基本消費(fèi)品供應(yīng)的票證制度、排他性的城市福利體制等,阻礙了勞動力這種生產(chǎn)要素在部門間、地域上和所有制之間的流動。在這種制度下,不存在勞動力市場,農(nóng)村居民沒有政府的許可不可能向城市流動,勞動和人事部門通過計(jì)劃來控制勞動力跨部門流動。
1978年底開始的農(nóng)村家庭承包制改革,使農(nóng)戶成為其邊際勞動努力的剩余索取者,從而解決了制度下因平均分配原則而長期解決不了的激勵問題(meng,2000)。與此同時,政府開始對價格進(jìn)行改革,誘導(dǎo)農(nóng)民提高農(nóng)業(yè)生產(chǎn)率。在農(nóng)業(yè)剩余勞動力被釋放出來后,非農(nóng)產(chǎn)業(yè)活動更高的報(bào)酬吸引勞動力轉(zhuǎn)移(cook,1999),從而推動農(nóng)村生產(chǎn)要素市場的發(fā)育,原來主要集中在農(nóng)業(yè)的勞動力開始向農(nóng)村非農(nóng)產(chǎn)業(yè)、小城鎮(zhèn)甚至大中城市流動。
由于各種阻礙勞動力流動的障礙尚未拆除,以及政府鼓勵農(nóng)村勞動力就地轉(zhuǎn)移的政策引導(dǎo),20世紀(jì)80年代前期的勞動力轉(zhuǎn)移以從農(nóng)業(yè)向農(nóng)村非農(nóng)產(chǎn)業(yè)轉(zhuǎn)移為主,主要是在鄉(xiāng)鎮(zhèn)企業(yè)中就業(yè),即所謂的“離土不離鄉(xiāng)”。但隨著鄉(xiāng)鎮(zhèn)企業(yè)遇到來自國有企業(yè)、“三資”企業(yè)和私人企業(yè)越來越強(qiáng)勁的競爭,必須提高技術(shù)水平和產(chǎn)品質(zhì)量,因而鄉(xiāng)鎮(zhèn)企業(yè)資本增加的速度逐漸加快,吸納勞動力的速度相應(yīng)減緩。農(nóng)村勞動力面臨著越來越強(qiáng)烈的跨地區(qū)轉(zhuǎn)移的壓力。與此同時,外商投資企業(yè)、中外合資企業(yè)、私營企業(yè)和股份公司等其他非國有部門在東部地區(qū)發(fā)展較快,擴(kuò)大了對勞動力需求,并成為消除制約勞動力流動體制障礙的一支重要力量。
隨著農(nóng)村勞動力就地轉(zhuǎn)移渠道日益狹窄,1983年政府開始允許農(nóng)民從事農(nóng)產(chǎn)品的長途販運(yùn)和自銷,第一次給予農(nóng)民異地經(jīng)營以合法性。1984年進(jìn)一步放松對勞動力流動的控制,甚至鼓勵勞動力到臨近小城鎮(zhèn)打工。1988年中央政府則開了先例,允許農(nóng)民自帶口糧進(jìn)入城市務(wù)工經(jīng)商。到20世紀(jì)90年代,中央政府和地方政府分別采取一系列措施,適當(dāng)放寬對遷移的政策限制,也就意味著對戶籍制度進(jìn)行了一定程度的改革。例如,許多各種規(guī)模的城市很早就實(shí)行了所謂的“藍(lán)印戶口”制度,把絕對的戶籍控制變?yōu)檫x擇性地接受。此外,1998年公安部對若干種人群開了進(jìn)入城市的綠燈,如子女可以隨父母任何一方進(jìn)行戶籍登記,長期兩地分居的夫妻可以調(diào)動到一起并得以戶籍轉(zhuǎn)換,老人可以隨子女而獲得城市戶口,等等。雖然執(zhí)行時在一些大城市遇到阻力,但至少在中央政府的層次上為戶籍制度的進(jìn)一步改革提供了合法性依據(jù)。城市福利制度的改革也為農(nóng)村勞動力向城市流動創(chuàng)造了制度環(huán)境。80年代后期開始逐步進(jìn)行的城市經(jīng)濟(jì)改革,如非國有經(jīng)濟(jì)的發(fā)展,糧食定量供給制度的改革,以及住房分配制度、醫(yī)療制度及就業(yè)制度的改革,降低了農(nóng)民向城市流動并居住下來和尋找工作的成本。
與其他方面的政策改革相比,戶籍制度改革在很長時間里沒有實(shí)質(zhì)性的突破,成為勞動力流動的最大障礙。所有在就業(yè)政策、保障體制和社會服務(wù)供給方面對外地人的歧視性對待,都根源于戶籍制度。隨著時間推移,兩方面的因素變化推動政府對遷移政策進(jìn)行改革。一是城市戶籍制度不再擁有外部或隱含的福利,也就是地方政府不再根據(jù)個人的戶籍來提供就業(yè)、社會福利等各方面保障。這樣,城市人口規(guī)模擴(kuò)張不會給地方政府增添額外財(cái)政負(fù)擔(dān)。二是地方政府意識到,勞動力流動不僅帶來資源重新配置,而且也是城市融資的一個重要來源。這樣,市場化發(fā)育水平相異的城市根據(jù)各自目標(biāo)來推進(jìn)城市戶籍制度改革。
可見,通過戶籍制度及一系列其他阻礙人口遷移的制度因素的改革而推動的勞動力流動,不僅是經(jīng)濟(jì)發(fā)展的一個重要內(nèi)容,也是整個經(jīng)濟(jì)體制向市場機(jī)制轉(zhuǎn)變的重要進(jìn)程,并且以其他領(lǐng)域改革的進(jìn)展為前提。這個轉(zhuǎn)變或改革的結(jié)果便是勞動力市場的形成與發(fā)育,勞動力資源越來越多地由市場來配置。而在整個經(jīng)濟(jì)不斷市場化的過程中,人口遷移也表現(xiàn)出轉(zhuǎn)軌時期的特點(diǎn)。這是中國轉(zhuǎn)軌時期人口遷移的特殊性所在。本文旨在利用2000年人口普查資料來分析人口流動與市場化之間的關(guān)系。
一、轉(zhuǎn)軌時期人口遷移理論
人口和勞動力在地區(qū)間的流動,是勞動力市場在空間上從不均衡向均衡轉(zhuǎn)變的過程。發(fā)展中國家在其經(jīng)濟(jì)發(fā)展過程中,伴隨著工業(yè)化和城市化發(fā)展,大量農(nóng)村人口和勞動力從農(nóng)村流向城市,從低生產(chǎn)率的農(nóng)業(yè)部門流向生產(chǎn)率較高的工業(yè)部門。劉易斯(lewis,1954)認(rèn)為,發(fā)展中國家存在著典型的二元經(jīng)濟(jì)結(jié)構(gòu),農(nóng)村存在著大量剩余勞動力和隱蔽性失業(yè),農(nóng)業(yè)中勞動力的邊際生產(chǎn)力幾乎等于零或?yàn)樨?fù)值,農(nóng)村勞動力從農(nóng)業(yè)部門流出不會對農(nóng)業(yè)產(chǎn)出帶來負(fù)面影響,反而使留在農(nóng)業(yè)部門勞動力的邊際產(chǎn)出不斷提高;隨著城市中勞動力數(shù)量不斷增加,城市工資水平開始下降,直至城市部門的工資水平與農(nóng)業(yè)部門的工資水平相等,農(nóng)村勞動力向城市流動才會停止。在劉易斯的模型中,勞動力在城鄉(xiāng)之間可以自由流動,不存在顯著的制度。城市現(xiàn)代部門的較高工資水平和傳統(tǒng)農(nóng)業(yè)部門的低工資水平,是勞動力在城鄉(xiāng)之間流動的驅(qū)動力量。在托達(dá)羅(todaro,1969;harris和todaro,1970)兩部門模型分析中,農(nóng)村人口和勞動力的遷移取決于城市的工資水平和就業(yè)概率,當(dāng)城市的預(yù)期收入水平和農(nóng)村的工資水平相等時,勞動力在城鄉(xiāng)之間分配和遷移都達(dá)到均衡。
由于城市經(jīng)濟(jì)存在著現(xiàn)代正規(guī)部門和非正規(guī)部門之分,農(nóng)村勞動力向城市遷移首先進(jìn)入非正規(guī)部門,然后才有可能進(jìn)入正規(guī)部門就業(yè)。城市正規(guī)部門就業(yè)創(chuàng)造率越大,越有利于將更多的非正規(guī)部門勞動力轉(zhuǎn)入正規(guī)部門;城鄉(xiāng)收入差距越大,從農(nóng)村流向城市非正規(guī)部門勞動力數(shù)量越多,城市非正規(guī)部門勞動力規(guī)模也越大。由于城市正規(guī)部門的就業(yè)創(chuàng)造率取決于工業(yè)產(chǎn)出增長率及該部門的勞動生產(chǎn)率增長率,城市工業(yè)的快速增長將有利于提高正規(guī)部門的就業(yè)創(chuàng)造率,從而減少城市非正規(guī)部門的勞動力規(guī)模。但是,這個效應(yīng)有可能被城市工資增長所誘發(fā)的大量新增農(nóng)村勞動力流入所抵消。因此,城市正規(guī)部門的就業(yè)創(chuàng)造結(jié)果帶來了城市失業(yè)率的上升。
費(fèi)爾茨(fields,1974)認(rèn)為,托達(dá)羅模型中沒有考慮農(nóng)村勞動力在城市正規(guī)部門尋找工作的概率問題。由于非正規(guī)部門勞動力獲得正規(guī)部門就業(yè)機(jī)會的相對概率較低,流入城市的農(nóng)村勞動力大多數(shù)只能滯留于非正規(guī)部門。他們之所以能夠接受較低的工資水平,主要是在于他們預(yù)期能夠從得到的城市正規(guī)部門工作機(jī)會中獲得補(bǔ)償。在托達(dá)羅模型基礎(chǔ)上,費(fèi)爾茨引入了搜尋工作機(jī)會的觀點(diǎn),一方面強(qiáng)調(diào)了城市制度工資和相對就業(yè)概率對遷移過程的影響,另一方面也指出,非正式部門大量不充分就業(yè)的勞動力保證了勞動力市場實(shí)現(xiàn)均衡時的失業(yè)率低于托達(dá)羅模型得出的估計(jì)。非正式部門大量不充分就業(yè)的勞動力存在,在一定程度上緩解了城市的失業(yè)問題。
隨著勞動力流動,城鄉(xiāng)勞動力市場開始相互作用。但是,根據(jù)托達(dá)羅理論,城市失業(yè)率上升將起到減緩人口繼續(xù)向城市遷移。如果依據(jù)費(fèi)爾茨的觀點(diǎn),城市勞動力市場似乎對農(nóng)村勞動力流動的影響不大。相比之下,在成熟的市場經(jīng)濟(jì)中,城市的失業(yè)率是影響勞動力流動的重要因素。托普爾(topel,1986)利用美國人口普查資料研究發(fā)現(xiàn),1970~1980年,美國東部、中部和北部各州的平均失業(yè)率相對于全國水平上升了23%,同時西部和西南部各州的失業(yè)率卻顯著下降。同期,人口遷移的空間流向恰好與此相反,人口凈流入地區(qū)為西部和西南部地區(qū),東部、中部和北部均為人口凈流出地區(qū)。
中國的人口遷移不僅具有發(fā)展中國家的一般特征,而且還有經(jīng)濟(jì)體制轉(zhuǎn)型的獨(dú)特之處。如前所述,中國特有的戶籍制度及其改革過程,為人口和勞動力自由流動和擇業(yè)提供了制度基礎(chǔ),這也是研究其他國家人口遷移的理論沒有遇到過的問題。隨著時間的推移,包括戶籍制度在內(nèi)的各項(xiàng)市場化改革措施必然對人口與勞動力遷移產(chǎn)生顯著影響。同時,城市就業(yè)環(huán)境變化也為我們觀察城鄉(xiāng)勞動力市場的相互作用提供了條件。
首先,不僅是城鄉(xiāng)之間、地區(qū)之間的收入差距驅(qū)動人口的遷移,市場化水平在城鄉(xiāng)和地區(qū)間的差異也直接影響農(nóng)村勞動力遷移決策,從而形成特定的遷移流向。在經(jīng)濟(jì)發(fā)展的初期,資本相對稀缺而勞動力相對豐富。因此,中國經(jīng)濟(jì)的比較優(yōu)勢在勞動密集型產(chǎn)業(yè)。在20世紀(jì)80年代以前的經(jīng)濟(jì)增長模式下,由于政府采取人為扭曲資金價格的方式,在資金密集型產(chǎn)業(yè)上投資過多,抑制了具有比較優(yōu)勢的勞動密集型產(chǎn)業(yè)的發(fā)展,導(dǎo)致產(chǎn)業(yè)結(jié)構(gòu)的扭曲,資源配置效率的損失。經(jīng)濟(jì)改革以來,通過一系列制度變革,資源配置逐漸轉(zhuǎn)向勞動力較為密集的產(chǎn)業(yè),較好地發(fā)揮了中國勞動力資源豐富的比較優(yōu)勢。產(chǎn)品和生產(chǎn)要素市場的發(fā)育帶來了資源重新配置效率的改善,對經(jīng)濟(jì)增長做出了重要的貢獻(xiàn)(cai等,2002)。由于生產(chǎn)要素市場發(fā)育上在地區(qū)之間不平衡,這種資源重新配置的效果主要體現(xiàn)在沿海地區(qū)。2000年,92.1%進(jìn)出口貿(mào)易集中在東部地區(qū),中西部地區(qū)分別為4.3%和3.6%.同年,86.5%的外商直接投資集中在東部地區(qū),中西部地區(qū)分別為8.9%和4.6%.因此,勞動力遷移在東部地區(qū)更為活躍,遷移的流向也以從中西部地區(qū)向東部地區(qū)為特征。
其次,正如在其他國家觀察到的那樣,較大的遷移距離增加了交通成本、弱化了社會網(wǎng)絡(luò)關(guān)系和目的地的就業(yè)信息,減少了遷移者的收益預(yù)期,因此,遷移距離上升降低了遷移發(fā)生概率。工作的不穩(wěn)定性和信息獲得的不確定性,不僅造成了遷移流向是一個從縣內(nèi)流向縣外,從省內(nèi)向省外的漸進(jìn)過程,而且使得親友等社會網(wǎng)絡(luò)成為遷移者獲得非正規(guī)部門就業(yè)信息的主要方式。格林伍得(greenwood,1969)認(rèn)為,遷移存量對人口在地區(qū)之間遷移扮演著社會網(wǎng)絡(luò)的作用。先前的遷移可以為后來者提供信息和其他方面的幫助,減少遷移風(fēng)險,從而對后期的遷移產(chǎn)生影響。蔡fǎng@①(cai,1999)研究發(fā)現(xiàn),75.8%的省內(nèi)遷移者、82.4%的跨省遷移者的就業(yè)信息獲得是通過住在城里或在城里找到工作的親戚、老鄉(xiāng)、朋友獲得的。因此,農(nóng)村勞動力向城市流動通常受到距離所反映出的社會網(wǎng)絡(luò)強(qiáng)弱的限制,形成分階段遷移。
第三,盡管戶籍制度繼續(xù)阻隔著農(nóng)村勞動力向城市遷移,但市場化改革使得城鄉(xiāng)勞動力市場開始融合,城市就業(yè)環(huán)境變化必然對農(nóng)村勞動力向城市流動帶來影響。隨著國有企業(yè)虧損和非國有部門擴(kuò)大,越來越多的原國有企業(yè)職工開始和遷移者在非正式部門展開就業(yè)競爭。在這種情況下,農(nóng)村勞動力“是走還是留”,取決于正式部門和非正式部門的就業(yè)狀況,而且其決策通常是暫時的,而不是長期的。這與harris和todaro(1970)模型中所討論的情況(遷移者在非正式部門臨時就業(yè)、等待得到正式部門就業(yè)機(jī)會),以及sethuraman(1981)觀察到其他發(fā)展中國家的情況(大多數(shù)遷移者將他們在非正式部門就業(yè)視為永久性的)都有顯著差異。一個普遍觀察到的現(xiàn)象是,中國農(nóng)村勞動力向城市和發(fā)達(dá)地區(qū)流動,通常具有季節(jié)性特點(diǎn),最多以年為單位在原住地和遷入地之間往返,呈現(xiàn)出“鐘擺式”的流動模式。正如solinger(1999)指出的那樣,城市對農(nóng)村勞動力的大量需求是推進(jìn)戶籍制度改革的必要條件。在非國有經(jīng)濟(jì)、特別是外商投資較快的地區(qū),市場力量日益顯現(xiàn),遷移受到鼓勵。
二、空間分布特征變化
1990年以來,中國地區(qū)收入差距進(jìn)一步擴(kuò)大,吸引了中西部地區(qū)勞動力向東部地區(qū)流動。同時,要素市場發(fā)育及資源配置市場化程度,對地區(qū)經(jīng)濟(jì)增長越來越起著主導(dǎo)性的作用。東部地區(qū)不僅對外開放時間早,而且市場發(fā)育迅速,較高的市場化水平不斷消除了勞動力等要素跨地區(qū)間流動的制度,以至成為勞動力流動的主要吸納地區(qū)。而勞動力向東部地區(qū)流動反過來也推動了該地區(qū)的經(jīng)濟(jì)增長,改善了勞動力資源配置效率(cai等,2002)。表1顯示了人口遷移空間分布狀況的長期變化。1987~2000年,人口遷移的空間分布特征是:地區(qū)內(nèi)部遷移(其中主要是省內(nèi)遷移)比例始終高于地區(qū)間的遷移比例。但地區(qū)內(nèi)部和地區(qū)之間的遷移比例則隨著時間不斷發(fā)生變化。東部地區(qū)內(nèi)部遷移比例提高,東部地區(qū)流向中西部地區(qū)的比例下降。而中西部正好與此相反,中部和西部地區(qū)內(nèi)部遷移比例趨于下降,中部向西部、西部向中部的遷移比例也在下降,而中西部向東部地區(qū)流入比例不斷上升。
注:(1)從統(tǒng)計(jì)口徑上看,1987年遷移數(shù)量包括遷入時間在半年以上的市、鎮(zhèn)和縣之間的遷移人口;1990年遷移數(shù)量包括遷入時間在1年以上的市、縣之間的遷移人口;1995年遷移數(shù)量包括遷入時間在半年以上的市,區(qū)、縣之間的遷移人口;2000年遷移數(shù)量包括遷入時間在半年以上的鄉(xiāng)、鎮(zhèn)、街道之間的遷移人口。(2)全部遷移人口包括地區(qū)內(nèi)部和地區(qū)之間的人口遷移,不同年份在遷移時間規(guī)定和遷移范圍上的差別對地區(qū)之間分布會帶來一定影響。盡管如此,我們?nèi)钥梢员容^不同年份之間遷移流向的變化。
資料來源:《1987年全國1%人口抽樣調(diào)查資料》、《1995年全國1%人口抽樣調(diào)查資料》、《中國1990年人口普查資料》、《中國2000年人口普查資料》。
根據(jù)2000年第五次人口普查的10%資料顯示,全部遷移人口數(shù)量為1246萬,占總?cè)丝诘?0.6%,其中省內(nèi)遷移為7.7%、跨省遷移為2.9%.在總遷移人口中,省內(nèi)遷移的比重始終很高,為73.4%.當(dāng)我們描述跨省遷移的流向時,其主要以東部地區(qū)為遷移目的地的傾向更加明顯。表2給出了三類地區(qū)跨省遷移比例的空間交叉分布。2000年,東部地區(qū)跨省遷移近65%集中在東部其他各?。ㄊ校胁康貐^(qū)跨省遷移超過84%集中在東部地區(qū),西部地區(qū)跨省遷移超過68%集中在東部地區(qū)。從時間趨勢上看,1987~2000年,東部地區(qū)內(nèi)部跨省遷移比例上升了近15%,而中西部地區(qū)向東部地區(qū)遷移比例上升將近24%,后者比前者高出9個百分點(diǎn)。
從流動的出發(fā)地和目的地看,遷移可以被劃分為城市到城市的遷移、城市到農(nóng)村的遷移、農(nóng)村到農(nóng)村的遷移和農(nóng)村到城市的遷移四種主要類型。從這種類型劃分來觀察地區(qū)間遷移的流向,也有助于我們理解轉(zhuǎn)軌時期中國人口遷移的特點(diǎn)。從全國來看,城市到城市的遷移和農(nóng)村到城市的遷移是目前遷移的主要形式。2000年,兩者合計(jì)占總遷移人口的77.9%,而且農(nóng)村到城市遷移的比重(40.7%)大于城市到城市的遷移(37.2%)。農(nóng)村到農(nóng)村的遷移比重較低,僅占全部遷移的18.2%.而城市到農(nóng)村的遷移比例最低,不到總遷移人口的1/25.從時間趨勢看,城市到城市的遷移所占比重,在東部、中部和西部三類地區(qū)都呈現(xiàn)上升趨勢,而農(nóng)村到城市的遷移比重略呈下降趨勢。
三、遷移的決定因素:計(jì)量分析
在遷移決定因素的實(shí)證分析中,早期的遷移模型將重力遷移模型和就業(yè)為目的的遷移模型合二為一,假定遷移數(shù)量不僅與遷入地和遷出地的人口和遷移距離有關(guān),而且取決于兩個地區(qū)之間的工資和失業(yè)率的比較。通常,采用下列雙對數(shù)模型來分析這些因素對遷移流向的影響(lowry,1966;greenwood,1969;fields,1979)。即:。式中,m為遷移率,x為影響遷移流向的各種因素,d為遷移距離,i,j分別為遷出地和遷入地。
舒爾茨(schultz,1982)認(rèn)為,人口變量反映的是其他影響遷移而沒有在模型出現(xiàn)的社會經(jīng)濟(jì)變量的作用,它沒有行為學(xué)上的意義。由于遷移是人口增長的一部分,在遷移實(shí)證模型中引入人口規(guī)模會帶來計(jì)量上的共同偏差(fields,1979)。而且,由于遷移存量實(shí)際上是人口規(guī)模的一部分,如果在實(shí)證模型中同時引入這兩個變量,將帶來嚴(yán)重的多重共線問題,大大降低回歸參數(shù)估計(jì)的效率。因此,通常做法是在實(shí)證模型中不引入人口變量。
在回歸方程的函數(shù)形式選擇上,費(fèi)爾茨(fields,1979)認(rèn)為,遷移決策本質(zhì)上是在相互排斥的替代方案之間的一種選擇,非對稱模型比對稱模型對人口遷移具有更強(qiáng)的解釋能力。此外,雙對數(shù)線性回歸方程還能夠消除奇異值和異方差對估計(jì)效率的影響,滿足理論上就業(yè)機(jī)會與工資之間的乘積要求,以及提高回歸方程的擬合程度等。他選擇了滯后解釋變量辦法來消除解釋變量的內(nèi)生性問題。我們也采用了所有解釋變量數(shù)據(jù)均為1995年數(shù)據(jù)的辦法來解決遷移模型的內(nèi)生性問題。
本文數(shù)據(jù)來自2000年第五次全國人口普查長表資料(10%樣本)和微觀數(shù)據(jù)(長表1%樣本),1995年全國1%人口抽樣調(diào)查資料及國家統(tǒng)計(jì)局《中國統(tǒng)計(jì)年鑒(1996)》。在數(shù)據(jù)處理上,正式出版的第五次人口普查長表資料沒有農(nóng)村向城市跨省遷移勞動力數(shù)量及其失業(yè)率數(shù)據(jù),我們利用第五次全國人口普查的微觀數(shù)據(jù)計(jì)算了這些數(shù)據(jù)。用于回歸分析變量的統(tǒng)計(jì)值見表3.
表3用于回歸分析變量的統(tǒng)計(jì)值
注:*根據(jù)微觀數(shù)據(jù)計(jì)算。
遷移率的計(jì)算,我們采用格林伍得(greenwood,1969)的定義,用1995年11月1日至2000年10月30日從省遷到省的人口數(shù),除以1995年11月1日以前住在省的人口數(shù)。根據(jù)長表計(jì)算得到的遷移率,包括了所有年齡段跨省農(nóng)村到城市、城市到城市、農(nóng)村到農(nóng)村、城市到農(nóng)村的四種類型遷移人口;用微觀數(shù)據(jù)計(jì)算15~64歲農(nóng)村勞動力向城市的遷移率。按照這種方法計(jì)算得到的兩個遷移率的平均值都不高(見表3)。
遷移距離為省會之間鐵路公里數(shù)。中國地域遼闊,鐵路是中國跨省遷移的主要交通方式。這點(diǎn)可以從每年春節(jié)農(nóng)民工返鄉(xiāng)造成的鐵路擁擠狀況中得到印證。遷移距離不僅反應(yīng)了用于直接交通費(fèi)用的高低,而且在一定程度上代表了遷移所帶來的心理成本大小。隨著遷移距離增加,遷移帶來的不確定性和遷移風(fēng)險也會上升,遷移成本隨之增加(schultz,1982;greenwood,1975)。這在勞動力市場不發(fā)達(dá)的情況下尤其如此。
直接用城市工工資收入和農(nóng)村人均純收入來作為工資率的變量顯然不合適。隨著收入多元化,相當(dāng)于實(shí)際收入的部分并沒有反映到名義收入之中,城鄉(xiāng)收入在可比性上也存在一定問題(solinger,1995;jefferson,1992)。奧尼爾(o''''neill,1970)建議采用消費(fèi)指標(biāo)來克服收入指標(biāo)作為工資率變量上的不足。我們利用各省城鄉(xiāng)人口作為權(quán)重,對城鄉(xiāng)居民人均消費(fèi)支出進(jìn)行加權(quán)平均,作為各省的工資率變量,預(yù)期工資率對遷移流向存在兩種不同的效應(yīng)。其中,遷入地為正向效應(yīng),而遷出地為負(fù)向效應(yīng)。
1995年全國1%抽樣調(diào)查和第五次人口普查都對城鄉(xiāng)勞動力的就業(yè)狀況進(jìn)行了統(tǒng)計(jì)。1995年調(diào)查問卷中有三項(xiàng)指標(biāo)用來測度勞動力在調(diào)查前一周是否處于失業(yè)狀態(tài):第一項(xiàng)是從未工作正在找工作,第二項(xiàng)是失去工作正在找工作,第三項(xiàng)是企業(yè)停產(chǎn)等待安置的勞動力。2000年人口普查只包括前兩項(xiàng)。據(jù)此可以計(jì)算得到1995年和2000年城鄉(xiāng)勞動力的失業(yè)率,分別為2.2%和3.6%.由于城鄉(xiāng)勞動力的失業(yè)率包括了農(nóng)村勞動力,這低估了城市勞動力市場的就業(yè)狀況。《中國2000年人口普查資料》公布了分城市、鎮(zhèn)和農(nóng)村的經(jīng)濟(jì)活動人口資料,據(jù)此計(jì)算的城市、鎮(zhèn)和農(nóng)村的失業(yè)率分別為9.4%、6.2%、1.2%.利用2000年微觀數(shù)據(jù)計(jì)算的城市本地勞動力、城市向城市遷移勞動力、農(nóng)村向城市遷移勞動力的失業(yè)率,分別為9.1%、7.9%和3.6%.如果在遷移模型中忽略了遷移存量,將導(dǎo)致高估其他解釋變量對遷移的影響(greenwood,1969)。按照格林伍得的方法,遷移存量應(yīng)該是以1995年為時點(diǎn),計(jì)算出生在省且居住在省的所有人口。由于中國人口普查資料只提供了出生后一直住在本地和1995年11月1日之前遷入本地等資料,因此,我們采用1995年11月1日之前遷入本地人口指標(biāo)作為遷移存量的變量。本文中長表的遷移存量包括所有人口,微觀數(shù)據(jù)的遷移存量只包括15~64歲的人口。我們預(yù)期遷移存量對人口遷移有正向效應(yīng)。
在分析地區(qū)人均收入差異和經(jīng)濟(jì)增長中,貿(mào)易開放程度通常被看做是影響地區(qū)收入增長的重要因素(barro和sala-i-martin,1995;cai等,2002)。貿(mào)易開放程度越高,參與國際市場一體化程度也越高。但是,扭曲的貿(mào)易和發(fā)展戰(zhàn)略也同樣起到擴(kuò)大出口,提高gdp中的貿(mào)易份額比重。相比之下,外商直接投資是國外投資者的選擇。從長期來看,為了獲得最大利潤和規(guī)避風(fēng)險,國外企業(yè)在其投資過程中要對各地的產(chǎn)品和要素市場發(fā)育情況、體制與政策的透明度等因素進(jìn)行綜合考慮,并最終做出投資選擇。外資企業(yè)進(jìn)入之后,它利用勞動力市場來解決用人需求,這與國有企業(yè)的人事制度形成鮮明對比。因此,我們選擇了外商直接投資作為市場化程度的變量,來分析它們對人口遷移的影響。改革以來,雖然所有省份的外商直接投資數(shù)量都在增加,但東部地區(qū)與中西部地區(qū)之間的差異在不斷擴(kuò)大。中國人口遷移流向分布主要集中在東部地區(qū),這與東部地區(qū)對市場化改革程度較高是分不開的。四、回歸結(jié)果與討論
方程1~3是利用第五次人口普查長表資料得到的回歸結(jié)果,方程4、5是利用第五次全國人口普查微觀數(shù)據(jù)得到的回歸結(jié)果。由于海南、重慶、與其他省會之間距離未能得到,在回歸中剔除了這3個地區(qū),長表資料中實(shí)際用于回歸的樣本數(shù)量為756個。在微觀數(shù)據(jù)中,由于有些省份的遷移率或農(nóng)村向城市遷移勞動力數(shù)量為零,取對數(shù)后,這些數(shù)據(jù)變成缺省值,所以用于回歸的樣本數(shù)量為506個。
從表4回歸結(jié)果看,利用長表資料得到的回歸方程,解釋了大約60%的所有人口跨省遷移的行為;用微觀數(shù)據(jù)得到的回歸方程,解釋了大約30%的跨省農(nóng)村勞動力向城市遷移的行為。表4的非對稱雙對數(shù)遷移模型估計(jì)結(jié)果也表明,遷入地社會經(jīng)濟(jì)變量對人口遷移的影響大于遷出地這些變量所發(fā)揮的作用。
回歸方程1~5中大多數(shù)解釋變量的回歸系數(shù)t值,如遷移距離、人均消費(fèi)水平、失業(yè)率、遷移存量等,都達(dá)到了1%或5%的顯著性水平,并且作用方向上與前面的理論預(yù)期結(jié)果也基本一致。
表4中回歸方程1和2的區(qū)別是采用了不同的失業(yè)率數(shù)據(jù),前者是1995年的失業(yè)率,后者是2000年的失業(yè)率。使用1995年失業(yè)率數(shù)據(jù)雖然有助于克服內(nèi)生性問題,但方程1中遷出地失業(yè)率回歸系數(shù)的絕對值大于遷入地失業(yè)率回歸系數(shù)的絕對值,這個結(jié)果可能與現(xiàn)實(shí)情況并不吻合。
1995~2000年,中國城市就業(yè)環(huán)境發(fā)生了急劇變化。伴隨著國有企業(yè)改革和城市社會福利體制改革,企業(yè)大量富余人員被釋放出來,城市失業(yè)率迅速上升。為了解決本地城市職工就業(yè)問題,不少地方政府采取了城市就業(yè)保護(hù)政策,這勢必對以就業(yè)為目的的勞動力流動產(chǎn)生較大影響。遷移者是理性的,如果目的地的就業(yè)機(jī)會較小,遷移者將選擇不流動,以減少遷移風(fēng)險和成本。這樣,遷入地的就業(yè)機(jī)會就顯得更為重要。
表4遷移決定因素回歸結(jié)果
注:(1)采用異方差檢驗(yàn)方法(breusch-pagan/cook-weisberg)發(fā)現(xiàn),表中回歸方程的依次為:7.85、1.54、1.38、2.80、4.85.我們對回歸方程1、5采用robust估計(jì)來消除異方差的影響。(2)方程1和5的括號內(nèi)為robustt值,方程2~4括號內(nèi)為t值,*代表5%顯著性水平,**代表1%顯著性水平。
考慮到2000年失業(yè)率真實(shí)地反映了就業(yè)環(huán)境的變化,我們以回歸方程2為基準(zhǔn),分析不同因素對遷移的影響,并進(jìn)行比較。在其他條件不變的情況下,遷移距離上升1%,遷移率下降1.08%.受遷移距離的影響,2000年跨省遷移人口比例不到30%,絕大多數(shù)遷移人口選擇了省內(nèi)流動。遷移距離在空間位置上是固定的,但改善交通運(yùn)輸條件和制定合理的交通價格有利于減少遷移者的遷移成本,促進(jìn)勞動力流動。
在做遷移決策時,潛在的遷移者不僅要考慮兩地之間直接的收入差距,而且還要考慮到就業(yè)機(jī)會大小。在回歸方程2中,遷入地人均消費(fèi)水平回歸系數(shù)在絕對值上是遷出地的近4倍,但遷入地失業(yè)率回歸系數(shù)在絕對值上是遷出地的3倍以上。遷入地失業(yè)率對遷移決策較大的邊際影響與遷移者面臨的選擇有關(guān)。本地勞動力市場狀況是既定的,遷移者對它別無選擇。相反,遷移者對遷入地勞動力市場是可以進(jìn)行選擇的,失業(yè)率越高的地區(qū),遷入數(shù)量就會下降。
目的地的就業(yè)信息提供和幫助,對遷移決策有重要作用。遷移存量的回歸系數(shù)也證實(shí)了這一點(diǎn)。社會網(wǎng)絡(luò)等非正規(guī)信息渠道雖然在遷移中發(fā)揮著重要作用,但隨著人口流動規(guī)模擴(kuò)大,加快勞動力市場信息體系建設(shè)就顯得非常重要。
將外商直接投資變量引入回歸方程2,就得到回歸方程3.引入這個變量之后,遷移距離和失業(yè)率等解釋變量的回歸系數(shù)及其顯著性變化不大,而人均消費(fèi)水平的回歸系數(shù)及其顯著性發(fā)生較大改變。從絕對值來看,方程3中的人均消費(fèi)水平回歸系數(shù)小于回歸方程2中的回歸系數(shù)估計(jì)值,遷出地人均消費(fèi)水平的回歸系數(shù)顯著性有所下降,主要是人均消費(fèi)水平與外商直接投資之間存在較高相關(guān)關(guān)系導(dǎo)致的結(jié)果(注:人均消費(fèi)水平與外商直接投資的相關(guān)系數(shù)為0.56.)??缡∪丝谶w移比例主要分布在東部地區(qū),它與外商直接投資之間存在較強(qiáng)的相關(guān)關(guān)系(注:外商直接投資與遷移存量之間的相關(guān)系數(shù)為0.76.),引入外商直接投資變量之后,遷移存量的回歸系數(shù)數(shù)值下降約50%.為了觀察城市勞動力市場對農(nóng)村勞動力遷移決策的影響,我們利用微觀數(shù)據(jù)做進(jìn)一步分析?;貧w方程4引入了農(nóng)村遷移勞動力的失業(yè)率,回歸結(jié)果進(jìn)一步支持上述發(fā)現(xiàn),即遷入地的就業(yè)機(jī)會對遷移者來說更為重要。回歸方程5引入了城市勞動力失業(yè)率。結(jié)果表明,城市失業(yè)率對于農(nóng)村勞動力跨省遷移率有顯著性影響,其回歸系數(shù)在絕對值上不僅大于回歸方程4中失業(yè)率的回歸系數(shù),而且大于回歸方程2中的回歸系數(shù),這說明城市勞動力市場就業(yè)形勢確實(shí)對農(nóng)村勞動力的遷移決策有重要作用。改善城市就業(yè)環(huán)境將有利于促進(jìn)農(nóng)村勞動力流向城市,起到加速城市化的作用。
五、結(jié)論
20世紀(jì)80年代以來在中國出現(xiàn)的大規(guī)模人口遷移現(xiàn)象,不僅具有發(fā)展中國家從落后的農(nóng)業(yè)經(jīng)濟(jì)向工業(yè)經(jīng)濟(jì)轉(zhuǎn)變的一般特征,還具有從計(jì)劃經(jīng)濟(jì)向市場經(jīng)濟(jì)轉(zhuǎn)變的特殊性。將二者結(jié)合在一起,既有助于考察中國獨(dú)特的制度特征對人口遷移的影響,又能夠通過對中國案例研究來拓展遷移理論。
經(jīng)濟(jì)發(fā)展水平和市場發(fā)育程度在地區(qū)之間的不平衡,決定了人口遷移的基本方向不僅是從農(nóng)村向城市的遷移,而且是從中西部地區(qū)向東部地區(qū)的遷移。既然中國經(jīng)濟(jì)的進(jìn)一步增長仍然有賴于從生產(chǎn)要素市場發(fā)育從而勞動力流動中獲得資源重新配置效率(注:約翰森(johnson,1999)認(rèn)為,在今后30年,如果遷移障礙被逐漸拆除,同時城鄉(xiāng)收入水平在人力資本可比的條件下達(dá)到幾乎相等的話,勞動力部門間轉(zhuǎn)移可以對年經(jīng)濟(jì)增長率貢獻(xiàn)2~3個百分點(diǎn)。),加快中西部地區(qū)市場制度的建設(shè),特別是清除阻礙勞動力市場發(fā)育的各種制度,可以引導(dǎo)和規(guī)范人口遷移,使其不僅具有微觀理性,而且具有更加理性的宏觀后果。市場化改革措施(如擴(kuò)大外商直接投資和對外貿(mào)易等)所帶來的經(jīng)濟(jì)發(fā)展將有助于獲得“一石二鳥”的功效,也就是講,它為勞動力流動不斷營造同樣的發(fā)展環(huán)境,并在創(chuàng)造就業(yè)機(jī)會的同時,推進(jìn)城鄉(xiāng)戶籍制度改革。
「作者簡介蔡昉中國社會科學(xué)院人口與勞動經(jīng)濟(jì)研究所所長、研究員;王德文中國社會科學(xué)院人口與勞動經(jīng)濟(jì)研究所,副研究員。
「參考文獻(xiàn)
1.中國社會科學(xué)院人口研究所(1988):《中國74城鎮(zhèn)遷移抽樣調(diào)查(1986)》,《中國人口科學(xué)》編輯部。
2.國家統(tǒng)計(jì)局(1988):《1987年全國1%人口抽樣調(diào)查資料》,中國統(tǒng)計(jì)出版社。
3.國家統(tǒng)計(jì)局(1997):《1995年全國1%人口抽樣調(diào)查資料》,中國統(tǒng)計(jì)出版社。
4.國務(wù)院人口普查辦公室(1993):《中國1990年人口普查資料》,中國統(tǒng)計(jì)出版社。
5.國務(wù)院人口普查辦公室(2002):《中國2000年人口普查資料》,中國統(tǒng)計(jì)出版社。
6.barro,r.&x.sala-i-martin(1995),economicgrowth.newyork:mcgrawhi,inc.
7.cai,fang(1999),spatialpatternsofmigrationunderchina''''sreformperiod,asianandpacificmigrationjournal,vol.8,no.3.
8.cai,fanganddewenwang(1999),sustainabilityofeconomicgrowthandlabourcontributioninchina,journalofeconomicresearch,no.10.
9.cai,fang,dewenwangandyangdu(2002),regionaldisparityandeconomicgrowthinchina:theimpactoflabormarketdistortions,chinaeconomicreview,13,197-212.
10.cook,sarah(1999),surpluslaborandproductivityinchineseagriculture:evidencefromhouseholdsurveydata,thejournalofdevelopmentstudies,vol.35,no.3:16-44.
11.fields,g.s.(1974),rural-urbanmigration,urbanunemploymentandunderemployment,andjob-searchactivityinldcs,journalofdevelopmenteconomics2,165-187.
12.fields,g.s.(1979),placetoplacemigration:somenewevidence,reviewofeconomicsandstatistics,vol.61,issue1,21-32.
13.greenwood,j.michael(1969),ananalysisofthedeterminantsofgeographiclabormobilityintheunitedstates,reviewofeconomicsandstatistics,vol.51,issue2,189-194.
14.greenwoodj.michad(1975),researchoninternalmigrationintheunitedstates:asurvey,journalofeconomicliterature,vol.13,issue2,397-433.
15.harris,j.,andm.todaro(1970),migration,unemploymentanddevelopment:atwosectoranalysis,americaeconomicreview40,126-142.
16.jefferson,g.h.andt.g.rawski(1992),unemployment,underemploymentandemploymentpolicyinchina''''scities,modernchina,18(1),42-71.
17.johnson,d.gale(1999),agriculturaladjustmentinchina:thetaiwanexperienceanditsimplications,officeofagriculturaleconomicsresearch,theuniversityofchicago.
18.leweis,w.a.(1954),economicdevelopmentwithunlimitedsuppliesoflabor,themanchesterschoolofeconomicandsocialstudies22,139-191,reprintedina.n.agarwalaands.p.singh(eds.),theeconomicsofunderdevelopment.bombay:oxforduniversitypress,1958.
19.lin,j.yifu,fangcai,andzhouli(1996),thechinamiracle:developmentstrategyandeconomicreform,hongkong:chineseuniversitypress.
20.lowry,i.s.(1966),migrationandmetropolitangrowth:twoanalyticalmodels.sanfrancisco:chandlerpublishing.
21.meng,xin(2000),labormarketreforminchina,cambridge,uk:cambridgeuniversitypress.
22.o''''neill,j.a.(1970),theeffectofincomeandeducationoninter-regionalmigration,unpublishedph.d.dissertation,columbiauniversity.
23.schultz,t.paul(1982),lifeiimemigrationwithineducationalstratainvenezuela:estimatesofalogisticmodel,economicdevelopmentandculturalchange,30(3),559-594.
24.solinger,d.(1995),thechineseworkunitandtransientlaborinthetransitionfromsocialism,modernchina,21(2),155-183.
25.solinger,d.(1999),citizenshipissuesinchina''''sinternalmigration:comparisonswithgermanyandjapan,politicalsciencequarterly,vol.114,no.3,455-478.
26.s.v.sethuramaned.(1981),theurbaninformalsectorindevelopingcountries,geneva:internationallaboroffice.
整個系統(tǒng)以廣電大數(shù)據(jù)分析平臺為基礎(chǔ)構(gòu)建,系統(tǒng)由數(shù)據(jù)采集系統(tǒng)、數(shù)據(jù)分析中心、三個數(shù)據(jù)應(yīng)用中心(推薦中心、決策中心和服務(wù)中心)組成和系統(tǒng)管理模塊組成。
1.1數(shù)據(jù)采集系統(tǒng)
大數(shù)據(jù)時代,大數(shù)據(jù)有著來源復(fù)雜、體量巨大、價值潛伏等特點(diǎn),這使得大數(shù)據(jù)分析必然要依托計(jì)算機(jī)技術(shù)予以實(shí)現(xiàn).因此從兩個方向上加強(qiáng)數(shù)據(jù)采集統(tǒng)建設(shè),一是側(cè)重于數(shù)據(jù)的處理與表示,強(qiáng)調(diào)采集、存取、加工和可視化數(shù)據(jù)的方法;二是研究數(shù)據(jù)的統(tǒng)計(jì)規(guī)律,側(cè)重于對微觀數(shù)據(jù)本質(zhì)特征的提取和模式發(fā)現(xiàn),在兩個方向上的協(xié)同、均衡推進(jìn),以此來保障大數(shù)據(jù)平臺應(yīng)用的穩(wěn)健成長和可持續(xù)發(fā)展.廣電的網(wǎng)絡(luò)和用戶是其核心資產(chǎn),而其中流動的數(shù)據(jù)(包括用戶基礎(chǔ)數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、網(wǎng)管/日志數(shù)據(jù)、用戶位置數(shù)據(jù)、終端信息等)是核心數(shù)據(jù)資產(chǎn).對于廣電運(yùn)營商來說,最有價值的數(shù)據(jù)來自基礎(chǔ)網(wǎng)絡(luò),對于基礎(chǔ)網(wǎng)絡(luò)數(shù)據(jù)的挖掘和分析是運(yùn)營商大數(shù)據(jù)挖掘的最重要方向.因此其數(shù)據(jù)采集的目標(biāo)包括機(jī)頂盒數(shù)據(jù)、CRM數(shù)據(jù)、帳務(wù)數(shù)據(jù)、客服數(shù)據(jù)、運(yùn)維數(shù)據(jù)、媒資數(shù)據(jù)、GIS數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)和其他手工錄入、表格數(shù)據(jù).采集頻率要求可以實(shí)現(xiàn)實(shí)時采集和定時批量采集.采集這類數(shù)據(jù)帶來一個問題就是各類數(shù)據(jù)雜亂無章,會導(dǎo)致數(shù)據(jù)質(zhì)量問題越來越嚴(yán)重,通過引進(jìn)實(shí)時質(zhì)量監(jiān)控和清洗技術(shù),建設(shè)強(qiáng)大的分布式計(jì)算和集群能力,提高數(shù)據(jù)監(jiān)控和數(shù)據(jù)采集性能,利用分布式處理技術(shù),實(shí)現(xiàn)數(shù)據(jù)抽取、數(shù)據(jù)清洗以及相應(yīng)的數(shù)據(jù)質(zhì)量檢查工作,保證采集到高質(zhì)量的數(shù)據(jù),將廣電大數(shù)據(jù)中心建設(shè)成一個覆蓋廣電系統(tǒng)全部數(shù)據(jù)的存儲中心,具備采集各類結(jié)構(gòu)化、非結(jié)構(gòu)化海量數(shù)據(jù)的處理能力.
1.2數(shù)據(jù)分析中心
廣電企業(yè)每時每刻都在產(chǎn)生大量的數(shù)據(jù),需要對這些數(shù)據(jù)歸集、提煉,廣電企業(yè)大數(shù)據(jù)平臺建設(shè)的意義在于有效掌握規(guī)模龐大的數(shù)據(jù)信息,對這些數(shù)據(jù)信息進(jìn)行智能處理,從中分析和挖掘出有價值的信息.在廣電大數(shù)據(jù)分析中需要對直播節(jié)目分析、互動業(yè)務(wù)分析、互聯(lián)網(wǎng)流量分析、互聯(lián)網(wǎng)內(nèi)容分析、廣電客戶分析、市場收益分析、智能內(nèi)容推送和廣告分析等,通過這類數(shù)據(jù)分析,能夠?qū)崟r了解廣電運(yùn)營商的經(jīng)營狀況,提供決策支持.因此采用兩種方式分析方法對收集到的數(shù)據(jù)進(jìn)行分析處理.一是采用在線分析方法技術(shù),使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達(dá)到深入理解數(shù)據(jù)的目的.這些信息是從原始數(shù)據(jù)直接轉(zhuǎn)換過來的,他們以用戶容易理解的方式反映企業(yè)的真實(shí)情況.在線分析策略是將關(guān)系型的或普通的數(shù)據(jù)進(jìn)行多維數(shù)據(jù)存貯,以便于進(jìn)行分析,從而達(dá)到在線分析處理的目的.這種多維數(shù)據(jù)存儲可以被看作一個超立方體,沿著各個維方向存貯數(shù)據(jù),它允許分析人員沿事物的軸線方便地分析數(shù)據(jù),分析形式一般有切片和切塊以及下鉆、挖掘等操作.二是數(shù)據(jù)挖掘是從海量、不完全的、有噪聲的數(shù)據(jù)中挖據(jù)出隱含的、未知的、用戶可能感興趣的和對決策有潛在價值的知識和規(guī)則.這些規(guī)則蘊(yùn)含了數(shù)據(jù)庫中一組對象之間的特定關(guān)系,揭示出一些有用的信息,可以為經(jīng)營決策、市場策劃和金融預(yù)測等方面提供依據(jù).
1.3數(shù)據(jù)應(yīng)用中心
在大數(shù)據(jù)分析平臺應(yīng)用過程中,數(shù)據(jù)本身并不是數(shù)據(jù)分析和數(shù)據(jù)挖掘的重點(diǎn),重點(diǎn)在于如何應(yīng)用這些技術(shù)去解決企業(yè)在運(yùn)營中實(shí)際的商業(yè)問題.通過對數(shù)據(jù)分析和挖掘,了解企業(yè)運(yùn)行過程存在問題,預(yù)判企業(yè)中各類業(yè)務(wù)發(fā)展走向.對數(shù)據(jù)分析與挖掘結(jié)果來說主要有兩個方面,一是將分析結(jié)果給客戶使用,另一個是將分析結(jié)果提供給內(nèi)部用戶使用,因此在大數(shù)據(jù)分析平臺設(shè)計(jì)中,將數(shù)據(jù)應(yīng)用劃分為三個應(yīng)用中心:
1)推薦中心
推薦中心面向收視、寬帶使用用戶,通過分析使用用戶的收視、互聯(lián)網(wǎng)、消費(fèi)等行為,將使用用戶分群,總結(jié)群體特征,向不同群體推薦個性化的電視節(jié)目、廣告和增值應(yīng)用服務(wù).從而提升用戶的使用體驗(yàn),提升用戶的滿意度和粘度.
2)決策中心
決策中心面向廣電企業(yè)內(nèi)部決策者、管理者、經(jīng)營分析人員,通過對企業(yè)經(jīng)營數(shù)據(jù)的KPI、運(yùn)營監(jiān)控、經(jīng)營盤點(diǎn),使企業(yè)決策者掌握企業(yè)運(yùn)營狀況及發(fā)展趨勢;智能報(bào)告協(xié)助分析人員自動定位經(jīng)營中的問題;即席查詢在預(yù)定義的語義層基礎(chǔ)上,實(shí)現(xiàn)靈活的自定義查詢;通過主題分析滿足各部門、崗位的多維度分析需求;通過專題分析就某一具體問題進(jìn)行深入挖掘,輔助專業(yè)分析人員的工作;統(tǒng)計(jì)報(bào)表滿足各部門常規(guī)統(tǒng)計(jì)需求.
3)服務(wù)中心
服務(wù)中心面向廣電的合作伙伴,比如:電視臺、廣告商、服務(wù)和內(nèi)容提供商、相關(guān)政府職能部門等.通過對使用用戶收視行為的實(shí)時分析,將電視欄目實(shí)時收視率提供給電視臺,電視臺根據(jù)收視率進(jìn)行在線的問卷調(diào)查,提高電視臺的影響力,幫助其增強(qiáng)欄目的評價體系.為廣告商提供精準(zhǔn)的廣告投放策略,實(shí)時準(zhǔn)確的廣告投放評估,幫助廣告商提升廣告到達(dá)率、準(zhǔn)確度和營銷效果.為服務(wù)和內(nèi)容提供商的電影、電視和增值應(yīng)用等產(chǎn)品提升收視率和使用頻率,并進(jìn)行評估,為其提供受眾喜好特征,幫助其推出有針對性的產(chǎn)品.通過用戶收視數(shù)據(jù)、節(jié)目反饋等信息,將相關(guān)輿情向相關(guān)政府部門匯報(bào).
1.4系統(tǒng)管理
系統(tǒng)管理是大數(shù)據(jù)分析平臺一個輔助功能模塊,主要是為了系統(tǒng)管理員對大數(shù)據(jù)平臺進(jìn)行有效的監(jiān)控和管理,提升大數(shù)據(jù)分析平臺性能使用,包含有如下幾個模塊:權(quán)限管理、數(shù)據(jù)質(zhì)量管理、元數(shù)據(jù)管理、調(diào)度管理、系統(tǒng)監(jiān)控等.
2數(shù)據(jù)應(yīng)用分析
移動互聯(lián)網(wǎng)的發(fā)展為傳統(tǒng)行業(yè)帶來了新的思考,如何在互聯(lián)網(wǎng)時代更好地實(shí)現(xiàn)以客戶為中心的服務(wù)理念,借助大數(shù)據(jù)分析平臺、海量的客戶非結(jié)構(gòu)化的行為數(shù)據(jù)和傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),可以有效提升廣電個性化、人性化的服務(wù)水平.大數(shù)據(jù)分析平臺通過整合廣電網(wǎng)絡(luò)中多個數(shù)據(jù)源,并按照主題進(jìn)行劃分,在定義主題的過程中,提供廣電業(yè)務(wù)概念的規(guī)范定義.?dāng)?shù)據(jù)模型不偏重于面向某個應(yīng)用,而是站在企業(yè)角度統(tǒng)攬全局,提供可擴(kuò)展的模型設(shè)計(jì),偏范式化的設(shè)計(jì)使平臺在最大程度上保持一致和靈活擴(kuò)展性.依托某廣電網(wǎng)絡(luò)公司業(yè)務(wù)開展情況,搭建數(shù)據(jù)分析平臺,具有如圖2所示的主題結(jié)構(gòu),共計(jì)8大類53小類,從廣電網(wǎng)絡(luò)運(yùn)營的各個方面進(jìn)行了數(shù)據(jù)分析.
2.1直播節(jié)目分析主題
直播電視節(jié)目作為廣電運(yùn)營模式中一直沿用的產(chǎn)品類型,對于廣電用戶的影響和廣電運(yùn)營商運(yùn)營模式起著至關(guān)重要的作用.實(shí)時直播節(jié)目分析,用戶可以實(shí)時查看每個時間點(diǎn)上每個節(jié)目收視率,以此為據(jù)來指導(dǎo)產(chǎn)品定制、節(jié)目選擇、用戶推廣等方面的商業(yè)應(yīng)用,對直播節(jié)目的多維度分析,運(yùn)營商可深入分析直播節(jié)目收視特性及受眾影響規(guī)律,以指導(dǎo)運(yùn)營優(yōu)化,提高節(jié)目的收視率和營收.
2.2多媒體業(yè)務(wù)分析主題
廣電行業(yè)的雙向網(wǎng)絡(luò)改造不僅將視頻點(diǎn)播、通信及娛樂業(yè)務(wù)成為可能,同時配備增值業(yè)務(wù),如廣告、支付、股票、游戲、付費(fèi)節(jié)目等服務(wù).可以明顯看到哪類業(yè)務(wù)最受歡迎,哪類業(yè)務(wù)的增長趨勢良好,哪類業(yè)務(wù)應(yīng)用下滑得較快,哪類業(yè)務(wù)不受用戶歡迎,從這樣的分析結(jié)果中,可以為廣電網(wǎng)絡(luò)以后的業(yè)務(wù)引進(jìn)中提供指導(dǎo),避免引進(jìn)的業(yè)務(wù)不受用戶歡迎,同時也可以預(yù)見性的引進(jìn)一些代表將來趨勢性的業(yè)務(wù),提前做好業(yè)務(wù)儲備工作.互動業(yè)務(wù)的互動特性為廣電運(yùn)營商增加客戶粘度、制定產(chǎn)品投放策略、獲取最大化收益及市場價值提供了前所未有的空間,通過對互動業(yè)務(wù)的應(yīng)用分析,可以分析出用戶的行為趨勢.利用這樣的分析結(jié)果改善廣電業(yè)務(wù)引進(jìn),提高用戶的粘度和ARPU值.
2.3互聯(lián)網(wǎng)應(yīng)用分析主題
廣電作為政府宣傳的喉舌,一個主要的特點(diǎn)就是可管可控,相對此而言,互聯(lián)網(wǎng)網(wǎng)絡(luò)一個重要特點(diǎn)就是用戶各類行為的不可控性.在三網(wǎng)融合的新環(huán)境下,廣電網(wǎng)絡(luò)一個重大改變就是引進(jìn)了互聯(lián)網(wǎng)業(yè)務(wù),同時通過多屏互動技術(shù)使廣電終端類型日益復(fù)雜,如何對廣電網(wǎng)絡(luò)引進(jìn)的互聯(lián)網(wǎng)業(yè)務(wù)和終端進(jìn)行有效的管控,成為擺在廣電網(wǎng)絡(luò)運(yùn)營商面前一個重要課題.運(yùn)營商可以清晰地看到用戶在討論什么、在看什么,以此來分析用戶將來可能采取的行為趨勢,進(jìn)而來引導(dǎo)用戶輿論與行為,實(shí)現(xiàn)對廣電網(wǎng)絡(luò)的可管可控的最終目的.同時廣電網(wǎng)絡(luò)也可以利用互聯(lián)網(wǎng)數(shù)據(jù)從如下兩方面做了分析,運(yùn)營流量及應(yīng)用優(yōu)化,節(jié)省網(wǎng)絡(luò)帶寬,減少運(yùn)營費(fèi),同時用以提高用戶體驗(yàn)度,增加用戶粘性;充分利用線上、線下同步運(yùn)營模式,深入挖掘線上討論內(nèi)容,為線下運(yùn)營提供指導(dǎo).
2.4廣電客戶分析主題
在三網(wǎng)融合的環(huán)境下,廣電網(wǎng)絡(luò)在逐漸擺脫事業(yè)單位模式下經(jīng)營模式,向“市場驅(qū)動”、“客戶驅(qū)動”經(jīng)營模式的轉(zhuǎn)變,“以客戶為中心”的理念和策略不可或缺,而廣電網(wǎng)絡(luò)擁有的客戶群和常規(guī)用戶分析的客戶群體有著本質(zhì)區(qū)別,以往分析往往針對個體用戶進(jìn)行分析,廣電網(wǎng)絡(luò)面向的用戶通常是以家庭為單位的,這給廣電網(wǎng)絡(luò)用戶行為分析帶來不可預(yù)料的困難.通過針對用戶群體不同年齡、不同時間段的收視行為和上網(wǎng)行為分析,可以區(qū)分某一時間段內(nèi)該家庭用戶內(nèi)個人的行為,可以清晰看到各類用戶在各個階段的變化情況,以及這個變化給廣電網(wǎng)絡(luò)運(yùn)營帶來的變化.從用戶信息出發(fā),以用戶應(yīng)用行為為主線,深入挖掘用戶關(guān)系,為廣電用戶關(guān)系管理提供有效基礎(chǔ)數(shù)據(jù),提高用戶滿意度、忠誠度,提高廣電網(wǎng)絡(luò)市場運(yùn)作的主動性.
2.5市場收益分析主題
三網(wǎng)融合后,廣電網(wǎng)絡(luò)作為一個市場主體,需要適應(yīng)日趨激烈的市場競爭環(huán)境,提升廣電運(yùn)營商的企業(yè)核心競爭力,應(yīng)充分利用業(yè)務(wù)支撐系統(tǒng)產(chǎn)生的大量寶貴的數(shù)據(jù)資源,建立廣電企業(yè)收益分析系統(tǒng),實(shí)現(xiàn)對收益數(shù)據(jù)的智能化加工和處理,為市場運(yùn)營工作提供及時、準(zhǔn)確、科學(xué)的決策依據(jù).利用先進(jìn)的OLAP技術(shù)和數(shù)據(jù)挖掘技術(shù),幫助企業(yè)的經(jīng)營決策層了解企業(yè)經(jīng)營的現(xiàn)狀,發(fā)現(xiàn)企業(yè)運(yùn)營的優(yōu)勢和劣勢,預(yù)測未來趨勢;幫助細(xì)分市場和客戶,指導(dǎo)營銷、客服部門進(jìn)行有針對性的營銷和高效的客戶關(guān)系管理;對決策的執(zhí)行情況和結(jié)果進(jìn)行客觀準(zhǔn)確的評估,深受用戶的青睞.如圖7所示的收益分析結(jié)果,可以清晰看出企業(yè)各類業(yè)務(wù)在營收中所占比例,可以明確了解哪類業(yè)務(wù)是企業(yè)的優(yōu)質(zhì)業(yè)務(wù),哪類業(yè)務(wù)需要進(jìn)一步加強(qiáng)開拓市場,同時也可以預(yù)測哪類業(yè)務(wù)會有更大的推廣空間,為企業(yè)持續(xù)開展業(yè)務(wù)提供指導(dǎo).
2.6智能內(nèi)容推送主題
深層次挖掘用戶潛在的需求,以用戶的需求為導(dǎo)向,向用戶推送有針對性的內(nèi)容.廣電運(yùn)營商通過對用戶差異性的運(yùn)營策略,激發(fā)用戶參與的熱情,讓用戶有持續(xù)的良好體驗(yàn),提升對用戶的吸引力和黏著度.信息精準(zhǔn)、智能推送的關(guān)鍵在于把握住用戶的行為習(xí)慣,同時讓每一個用戶都可以按自己需求方便、快捷地調(diào)整、歸類相關(guān)信息.大數(shù)據(jù)分析平臺基于用戶行為收集分析系統(tǒng),挖掘出用戶潛在需求,充分了解了用戶的真實(shí)意愿,將有助于廣電運(yùn)營商建立以客戶為中心的服務(wù)理念,提升社會影響力.
3總結(jié)
隨著煙草行業(yè)信息化推進(jìn)現(xiàn)代化進(jìn)程的快速發(fā)展,新興的IT技術(shù)、先進(jìn)的IT技術(shù)等已不斷融入到煙草行業(yè)的生產(chǎn)、營銷及管理等過程中,逐漸改變了煙草行業(yè)原有的經(jīng)營管理模式,加快了煙草行業(yè)結(jié)構(gòu)調(diào)整,完善管理體制,提升市場競爭力??梢哉f,信息化建設(shè)給煙草行業(yè)帶來了改革與發(fā)展。因此,對新興技術(shù)的研究與探索,具有十分重要的意義。尤其是視頻監(jiān)控技術(shù)的發(fā)展,給煙草行業(yè)的帶來了較多的好處,煙草從種植、生產(chǎn)、流通、消費(fèi)的每個環(huán)節(jié)中,視頻監(jiān)控技術(shù)都發(fā)揮了重要作用。視頻大數(shù)據(jù)分析技術(shù)是近兩年興起的技術(shù),視頻大數(shù)據(jù)分析的應(yīng)用,在公安視頻偵查等中已突顯其發(fā)展前景,本文將針對煙草行業(yè),討論視頻大數(shù)據(jù)分析的發(fā)展應(yīng)用。
2視頻監(jiān)控在煙草行業(yè)的發(fā)展及應(yīng)用現(xiàn)狀
(1)煙田監(jiān)控:實(shí)現(xiàn)對煙田、育苗大棚內(nèi)實(shí)時監(jiān)控;
(2)煙葉收購站監(jiān)控:實(shí)現(xiàn)對煙草所有站點(diǎn)煙葉收購全流程監(jiān)控視頻調(diào)看、查詢、巡視、控制的功能;
(3)生產(chǎn)及公用設(shè)施區(qū)監(jiān)控:主要用于監(jiān)控車間內(nèi)重要設(shè)備、生產(chǎn)線運(yùn)行、物流線路及環(huán)境狀況,以及動力中心車間內(nèi)空調(diào)、鍋爐等重要設(shè)備的運(yùn)行及環(huán)境狀況,防止災(zāi)害和事故的發(fā)生。
(4)煙草物流配送中心監(jiān)控:對物流配送中心進(jìn)行實(shí)時監(jiān)控;
3視頻大數(shù)據(jù)分析的技術(shù)需求
隨著視頻監(jiān)控在煙草行業(yè)的大規(guī)模應(yīng)用,視頻數(shù)據(jù)量的增加,每天產(chǎn)生的數(shù)據(jù)量都是以TB(1000GB)級別計(jì)算的,若是利用傳統(tǒng)的技術(shù)手段對每天的視頻進(jìn)行檢索和分析,則需要數(shù)小時的時間才能夠完成,工作量及工作難度可想而知;而對于更高級別的視頻數(shù)據(jù),如PB(1000TB)級別的視頻數(shù)據(jù)進(jìn)行分析和檢索時間那就是很多天了。視頻檢索與分析的效率低下,也是目前視頻數(shù)據(jù)利用效率及數(shù)據(jù)價值低下的首要原因。為此,如何提高視頻數(shù)據(jù)分析與檢索的效率,如何針對PB(1000TB)級別甚至EB(1000PB)級別的海量數(shù)據(jù)進(jìn)行分析與檢索,提升視頻監(jiān)控?cái)?shù)據(jù)價值,成為了當(dāng)前用戶的首要需求,也成為了當(dāng)前視頻大數(shù)據(jù)分析技術(shù)的難點(diǎn)及關(guān)鍵點(diǎn)之一。同時,在對視頻進(jìn)行檢索與分析的過程中,需要考慮檢索結(jié)果的準(zhǔn)確性。由于視頻圖像信息為非結(jié)構(gòu)化數(shù)據(jù),如何合理有效地對非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行檢索分析,優(yōu)化計(jì)算機(jī)圖像識別算法,是提高視頻大數(shù)據(jù)分析準(zhǔn)確性關(guān)鍵所在。再者,當(dāng)完成視頻檢索與分析后,如何做好視頻數(shù)據(jù)與非視屏數(shù)據(jù)的整合與關(guān)聯(lián)工作,是后期視頻數(shù)據(jù)應(yīng)用時重點(diǎn)考慮的內(nèi)容。
4視頻大數(shù)據(jù)在煙草行業(yè)的應(yīng)用思考
時下,煙田監(jiān)控、煙葉收購站監(jiān)控、生產(chǎn)及公用設(shè)施區(qū)監(jiān)控、煙草物流配送中心監(jiān)控等的視頻監(jiān)控?cái)?shù)據(jù)較多僅僅用作安防視頻使用,還未涉及到與煙草業(yè)務(wù)的關(guān)聯(lián);隨著視頻監(jiān)控建設(shè)的完善及視頻大數(shù)據(jù)技術(shù)發(fā)展,各類監(jiān)控視頻數(shù)據(jù)量的增加,考慮到投資回報(bào)比,是否可以通過視頻大數(shù)據(jù)分析,將煙草業(yè)務(wù)與視頻監(jiān)控相關(guān)聯(lián),在海量的視頻監(jiān)控?cái)?shù)據(jù)中提取有益于煙草行業(yè)發(fā)展的變革或新技術(shù)呢?
4.1安防業(yè)務(wù)
基于傳統(tǒng)視頻監(jiān)控,安防業(yè)務(wù)是傳統(tǒng)業(yè)務(wù)之一,通過大數(shù)據(jù)分析,有效快捷的提取安防所需要的視頻片段。同時基于視頻行為告警策略,及時告警。
4.2安全生產(chǎn)
結(jié)合視頻大數(shù)據(jù)分析,將以往多次生產(chǎn)事故監(jiān)控視頻整合,通過對多次生產(chǎn)安全事故的分析,總結(jié)出更為安全可靠的生產(chǎn)規(guī)則;再則通過視頻監(jiān)控與生產(chǎn)行為的結(jié)合,制定安全生產(chǎn)標(biāo)準(zhǔn),通過聲音報(bào)警或警示燈報(bào)警等技術(shù),在不符合標(biāo)準(zhǔn)視頻監(jiān)控預(yù)定義的安全規(guī)則情況時,能夠及時報(bào)警。通過視頻監(jiān)控分析,提升生產(chǎn)的安全性。如采用彩色網(wǎng)絡(luò)快球攝像機(jī)和彩色固定網(wǎng)絡(luò)槍式攝像機(jī),彩色網(wǎng)絡(luò)快球攝像機(jī)的預(yù)制位設(shè)置應(yīng)優(yōu)先,根據(jù)視頻大數(shù)據(jù)分析后,系統(tǒng)可提供不同故障區(qū)域或設(shè)備的故障信號,各工藝段或設(shè)備的操作運(yùn)行信號,通過系統(tǒng)集成與生產(chǎn)監(jiān)控實(shí)現(xiàn)聯(lián)動,平常攝像機(jī)對正在操作或運(yùn)行設(shè)備進(jìn)行監(jiān)控,一旦某個故障點(diǎn)報(bào)警,攝像機(jī)立刻自動轉(zhuǎn)動到報(bào)警點(diǎn),監(jiān)控中心的NVR主機(jī)開始錄像等。
4.3效率生產(chǎn)
結(jié)合視頻大數(shù)據(jù)分析,通過分析各個不同煙站或煙廠中的同一種生產(chǎn)行為,結(jié)合對海量數(shù)據(jù)進(jìn)行智能分析,提取出價值數(shù)據(jù)片段,形成元數(shù)據(jù)信息庫,再通過人為加工后期數(shù)據(jù),總結(jié)形成效率生產(chǎn)有用的價值信息,提供生產(chǎn)借鑒,提高生產(chǎn)效率。
4.4創(chuàng)新生產(chǎn)
通過視頻大數(shù)據(jù)分析,將以往的視頻通過軌跡分析,得出以往生產(chǎn)過程中各類生產(chǎn)動作中不必要或者多余的部分,簡化或者優(yōu)化生產(chǎn)規(guī)則;通過對給類生產(chǎn)行為的總結(jié),提出合理的建議,為生產(chǎn)提出創(chuàng)新性意見或建議,提高生產(chǎn)率。
5結(jié)論
系統(tǒng)主要實(shí)現(xiàn)軟件的模塊話設(shè)計(jì),包括反射率數(shù)據(jù)分析模塊、速度分析模塊、天線運(yùn)行穩(wěn)定性分析模塊以及雷達(dá)組網(wǎng)數(shù)據(jù)分析模塊。
1.1反射率分析模塊
反射率的大小體現(xiàn)了氣象目標(biāo)的降水粒子的密度分布及體積大小,在實(shí)際氣象技術(shù)中長期用于表示氣象目標(biāo)的強(qiáng)度,在工作上采用dBZ單位表示。對于空管氣象雷達(dá)圖,數(shù)據(jù)顯示采用PPI(PlanPositionImage)顯示方式。該方式?jīng)Q定了一張氣象雷達(dá)圖由圓錐俯視平面上分析空間的回波構(gòu)成。在設(shè)計(jì)上簡單介紹其設(shè)計(jì)流程,首先必須讀取原始數(shù)據(jù),并判斷是否首次讀取,若為首次讀取則對其進(jìn)行預(yù)處理,否則進(jìn)行坐標(biāo)轉(zhuǎn)換;其次進(jìn)行圖像繪制并判斷是否需要改變仰角。此處需要關(guān)注的關(guān)鍵是如何進(jìn)行數(shù)據(jù)的預(yù)處理。在實(shí)現(xiàn)上,對接收的數(shù)據(jù)進(jìn)行反射率信息結(jié)構(gòu)體賦值。當(dāng)然該結(jié)構(gòu)體包括了記錄實(shí)際仰角角度、數(shù)據(jù)文件路徑存儲、雷達(dá)波段判斷以及相關(guān)數(shù)據(jù)的偏移。通過掃描上述結(jié)構(gòu)體可以實(shí)現(xiàn)對雷達(dá)數(shù)據(jù)的預(yù)處理。
1.2速度分析模塊
多普勒雷達(dá)采用了速度退化模糊技術(shù)以擴(kuò)大其對徑向風(fēng)速測量不模糊的區(qū)間。結(jié)構(gòu)設(shè)計(jì)主要考慮數(shù)據(jù)顯示的徑向方式,流程設(shè)計(jì)則與反射模塊類似。當(dāng)然在界面設(shè)計(jì)上,系統(tǒng)將提供對顏色配置的定義,使其人機(jī)交互更為快捷。
1.3天線穩(wěn)定性分析模塊
天線是雷達(dá)數(shù)據(jù)采集的關(guān)鍵部位,長期以來是影響雷達(dá)運(yùn)行的主要關(guān)鍵點(diǎn)之一。其依賴于底下的電機(jī)進(jìn)行旋轉(zhuǎn),目前大多數(shù)進(jìn)口電機(jī)可以保證24小時安全運(yùn)行。而運(yùn)行時仰角提升和轉(zhuǎn)速的平穩(wěn)性直接影響雷達(dá)數(shù)據(jù)的采集。為此,我們通過在徑向數(shù)據(jù)上采用方位角及仰角進(jìn)行掃描實(shí)現(xiàn)曲線圖監(jiān)控。通過選擇基數(shù)據(jù)再進(jìn)行預(yù)處理后繪制相關(guān)曲線實(shí)現(xiàn)對天線運(yùn)行狀態(tài)的評估。其中,曲線圖的繪制需要的參數(shù)為:縱坐標(biāo)為氣象雷達(dá)實(shí)際運(yùn)行的每層仰角均值;橫坐標(biāo)為范圍角:0-360°。
1.4雷達(dá)組網(wǎng)分析模塊
按照民航局的總體規(guī)劃,未來空管將實(shí)現(xiàn)多氣象雷達(dá)覆蓋,在這過程,多個氣象雷達(dá)的組網(wǎng)將成為氣象雷達(dá)數(shù)據(jù)的主要來源。這種模式將使得數(shù)據(jù)覆蓋面更大、數(shù)據(jù)安全性更高、數(shù)據(jù)準(zhǔn)確性更強(qiáng)。而與此同時帶來了雷達(dá)數(shù)據(jù)融合組網(wǎng)的技術(shù)難點(diǎn)。設(shè)計(jì)上,首先模塊將定義雷達(dá)站點(diǎn)配置信息,并與此同時提供組網(wǎng)雷達(dá)可選數(shù)據(jù);其次對選擇雷達(dá)數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;再之則對雷達(dá)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)平均并做坐標(biāo)轉(zhuǎn)換;最后進(jìn)行拼圖處理。在這過程中,需要對雷達(dá)數(shù)據(jù)的強(qiáng)度進(jìn)行自適應(yīng)調(diào)整、顯示范圍自適應(yīng)調(diào)整。與上述同理,系統(tǒng)核心在于預(yù)處理。在C#中定義List數(shù)據(jù)列表,并在定義其結(jié)構(gòu)為[站點(diǎn)標(biāo)示][距離][方位角],對于數(shù)據(jù)讀取時,需要進(jìn)行插值算法處理,此時的單時數(shù)據(jù)拼接分析可以實(shí)現(xiàn)不同仰角和方位角的篩選。為了控制系統(tǒng)數(shù)據(jù)的準(zhǔn)確性可以在前端定義雷達(dá)數(shù)據(jù)方位角表,根據(jù)表進(jìn)行映射處理。通常如若出現(xiàn)非連續(xù)數(shù)據(jù)可以在預(yù)處理上對其進(jìn)行差值補(bǔ)償。在C#上可以采用反差圓補(bǔ)償方法。
2.結(jié)束語