時間:2023-06-25 16:04:21
序論:在您撰寫數(shù)據(jù)分析方向時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導您走向新的創(chuàng)作高度。
1.流量來源
從圖中數(shù)據(jù)顯示,該網(wǎng)站主要流量來源于外部鏈接,表明各種推廣營銷手段還是有一定效果的,而直接訪問帶來的流量卻不太理想,說明該其用戶忠誠度較低,需要繼續(xù)加強。而搜索引擎流量的話其主要靠內(nèi)容,而從該站數(shù)據(jù)看來,其內(nèi)容還是比較欠缺,需要加強優(yōu)化。。
2. 網(wǎng)站訪問時段
從上圖觀察發(fā)現(xiàn),我們可以分析出用戶在上午9點-11點,下午14點-17點,這兩個時段較為活躍,那么便可根據(jù)此進行推廣,因為訪客越是活躍,進行推廣便更嘔效果。同樣的,在做競價推廣時,也可以此作為參考。
3. 搜索引擎分析
有統(tǒng)計數(shù)據(jù)可以發(fā)現(xiàn),各個搜索引擎過來的流量有多少,而從該網(wǎng)站數(shù)據(jù)上看,該網(wǎng)站的主要訪客來源于百度,竟然如此,該站就更加需要加強百度優(yōu)化,更多的去迎合百度。
4.搜索詞
通過對搜索詞的查看,我們可以查看用戶主要通過哪些詞來到該網(wǎng)站,從而可根據(jù)此來對長尾關(guān)鍵詞進行挖掘。同時我們可以發(fā)現(xiàn)用戶是通過一些我們根本想不到的詞來訪問網(wǎng)站,通過這些詞我也可作為研究用戶搜索習慣的重要參考因素。
5.訪問時長及跳出率
通過對訪客的頁面停留時間長短及跳出率,我們可以分析出用戶的需求點,從而分析出哪些最終頁,哪些是過度頁。如此此我們就可以根據(jù)此來對頁面進行優(yōu)化,以及分析哪些欄目更應放在首頁等。
6.瀏覽器訪問比例
這個數(shù)據(jù)通常告訴我們應如何去設(shè)計網(wǎng)頁,從圖中可以看出瀏覽器中360與ie用戶量比例較大。因此在我們對該網(wǎng)站頁面進行設(shè)計或改版時,需要重點滿足IE與360用戶的需求,同時要保證網(wǎng)頁在IE與360下的兼容性。
關(guān)鍵詞:大數(shù)據(jù) 統(tǒng)計專業(yè) 核心
中圖分類號:G632 文獻標識碼:A 文章編號:1674-2117(2014)10-0008-02
1 大數(shù)據(jù)的統(tǒng)計涵義
通常來說,凡是數(shù)據(jù)量超過一定大小,導致常規(guī)軟件無法在一個可接受的時間范圍內(nèi)完成對其進行抓取、管理和處理工作的數(shù)據(jù)即可稱為大數(shù)據(jù)。業(yè)界通常用4個V(即Volume、Variety、Value、Velocity)來概括大數(shù)據(jù)的特征:數(shù)據(jù)體量巨大、數(shù)據(jù)類型繁多、價值密度低、處理速度快。
大數(shù)據(jù)潮流讓我們獲得了海量的數(shù)據(jù),數(shù)據(jù)已經(jīng)成為相關(guān)行業(yè)創(chuàng)造價值的重要資源。因此,許多IT企業(yè)和互聯(lián)網(wǎng)企業(yè)都已將業(yè)務范圍延伸至大數(shù)據(jù)產(chǎn)業(yè),探索大數(shù)據(jù)驅(qū)動的業(yè)務模式。2012年,美國政府投資2億美元啟動的“大數(shù)據(jù)研究和發(fā)展計劃”,更是將大數(shù)據(jù)的研究上升到國家戰(zhàn)略層面。然而,大數(shù)據(jù)的真正意義不在于數(shù)據(jù)量的巨大,而在于對數(shù)據(jù)信息進行專業(yè)化的處理,核心是對數(shù)據(jù)進行分析。面對大數(shù)據(jù),越來越多的領(lǐng)域都開始運用數(shù)學特別是統(tǒng)計學的工具,挖掘大數(shù)據(jù)中真正蘊藏的價值。正如西內(nèi)啟在《看穿一切數(shù)字的統(tǒng)計學》書中所指出的,“從數(shù)據(jù)中得出有意義的結(jié)果,關(guān)鍵在于控制和減少誤差,得出因果關(guān)系,單純收集數(shù)據(jù)并加以全部量化分析在很多情況下會得出謬誤結(jié)果,”而科學的統(tǒng)計學方法是得出因果關(guān)系的最佳方法。
從統(tǒng)計學角度看,一方面,大數(shù)據(jù)具有類型繁多、結(jié)構(gòu)復雜、體量巨大等特點,海量數(shù)據(jù)以分布式方式進行存儲,特別是圖片、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù)的廣泛存在,傳統(tǒng)的統(tǒng)計方法和統(tǒng)計分析工具已無法滿足大數(shù)據(jù)分析的需要,亟需統(tǒng)計方法的革新。另一方面,數(shù)據(jù)分析結(jié)果需要用生動、直觀、容易被接受的方式展示給讀者,可視化分析能夠直觀地呈現(xiàn)大數(shù)據(jù)的特點,闡釋數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系。因此,統(tǒng)計學要挺立大數(shù)據(jù)潮頭,創(chuàng)新統(tǒng)計分析工具、可視化分析方法,以大數(shù)據(jù)的挖掘和應用為核心,將傳統(tǒng)文本、圖像的統(tǒng)計、分析向數(shù)據(jù)分析轉(zhuǎn)變,以適應大數(shù)據(jù)時代的發(fā)展及其對統(tǒng)計學帶來的挑戰(zhàn)。
2 大數(shù)據(jù)時代統(tǒng)計學教育面臨的挑戰(zhàn)與應對
據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心(Internet Data Center)預測,中國大數(shù)據(jù)技術(shù)與服務市場將會從2011年的7760萬美元快速增長到2016年的6.16億美元,而據(jù)業(yè)界專家估算,中國大數(shù)據(jù)市場的人才需求量至少為100萬人,其中統(tǒng)計人才、技術(shù)更是捉襟見肘。傳統(tǒng)數(shù)據(jù)收集和分析技術(shù)的知識結(jié)構(gòu)已不能滿足大數(shù)據(jù)時代對“數(shù)據(jù)科學家”的要求,多家企業(yè)在面對大數(shù)據(jù)發(fā)展時遭遇人才瓶頸。大數(shù)據(jù)相關(guān)人才供給不足將會成為影響大數(shù)據(jù)市場發(fā)展的一個重要因素。
當前,全世界范圍內(nèi)已有數(shù)百個高校開設(shè)了大數(shù)據(jù)分析專業(yè)。卡內(nèi)基梅隆大學和新澤西州立大學在培養(yǎng)目標和課程設(shè)置上項目設(shè)置偏重于計算機方向。課程設(shè)置偏重統(tǒng)計學與運籌學(包括決策科學)的典型學校有田納西大學和約克大學。2013年,北京航空航天大學與慧科教育合作開辦了國內(nèi)首個“大數(shù)據(jù)技術(shù)與應用”軟件工程碩士項目研究生班,這是目前國內(nèi)唯一一個培養(yǎng)大數(shù)據(jù)行業(yè)專業(yè)型人才的項目,但其培養(yǎng)目標、知識體系是面向計算機領(lǐng)域,而立足統(tǒng)計學基礎(chǔ)的大數(shù)據(jù)分析人才培養(yǎng)項目,在國內(nèi)可謂是鳳毛麟角。
知者隨事而制。高等院校統(tǒng)計學專業(yè)要通過有效利用和整合人才培養(yǎng)資源,承擔大學人才培養(yǎng)的責任,駕馭大數(shù)據(jù)的浪潮,占領(lǐng)大數(shù)據(jù)發(fā)展人才培養(yǎng)的制高點,體現(xiàn)高等院校向社會、企業(yè)提供智力支撐,輸送企業(yè)亟需的復合型、實用性大數(shù)據(jù)分析人才的載體作用,確保產(chǎn)業(yè)科學、持續(xù)、高速的發(fā)展。一是教育資源的整合,走在前列的首都經(jīng)濟貿(mào)易大學、北京大學、中國人民大學、中國科學院大學、中央財經(jīng)大學五所應用統(tǒng)計專業(yè)碩士培養(yǎng)單位在北京成立了“中國大數(shù)據(jù)教育協(xié)同創(chuàng)新體”,在高校之間實現(xiàn)學科融合、優(yōu)勢互補、強強聯(lián)合,通過共享優(yōu)質(zhì)資源平臺、共同建立課程體系、共同建設(shè)案例資源庫、聯(lián)合搭建實踐實訓平臺等多種形式,創(chuàng)新人才培養(yǎng)體制機制。二是高等院校教育資源與業(yè)界資源的整合,通過與國有超大型企業(yè)、互聯(lián)網(wǎng)翹楚的協(xié)同培養(yǎng),立足應用統(tǒng)計專業(yè)碩士教育,建立人才培養(yǎng)基地,進行協(xié)同創(chuàng)新,探索構(gòu)建應用統(tǒng)計(大數(shù)據(jù)分析)專業(yè)碩士人才協(xié)同培養(yǎng)模式。以緩解當前大數(shù)據(jù)人才供需矛盾為目的,建立“校校協(xié)同、校企協(xié)同、院系協(xié)同”的大數(shù)據(jù)分析方向人才協(xié)同培養(yǎng)模式,最終實現(xiàn)協(xié)同培養(yǎng)“數(shù)據(jù)科學家”的目標。[5]
3 面向大數(shù)據(jù)分析方向的應用統(tǒng)計專業(yè)碩士培養(yǎng)模式的構(gòu)建
本研究認為,可以將大數(shù)據(jù)分析及相關(guān)的案例教學模式融入應用統(tǒng)計專業(yè)碩士學位研究生的培養(yǎng)過程,進而打破統(tǒng)計學傳統(tǒng)的以闡述統(tǒng)計理論、公式推導、數(shù)學計算為主的教學模式。以情境浸潤為基礎(chǔ),為學生呈現(xiàn)統(tǒng)計學在大數(shù)據(jù)領(lǐng)域應用為核心的教學模式,可以培養(yǎng)學生對大數(shù)據(jù)的挖掘、整合、分析價值的能力,以期更好、更快地適應企業(yè)對數(shù)據(jù)分析師、數(shù)據(jù)科學家的需求。
3.1 科學構(gòu)建課程體系,突出大數(shù)據(jù)分析特點
大數(shù)據(jù)具有強烈的行業(yè)特點,在充分借鑒國外大學成功經(jīng)驗的基礎(chǔ)上,大數(shù)據(jù)分析專業(yè)碩士的課程設(shè)置,強化數(shù)據(jù)分析能力和數(shù)據(jù)挖掘能力,注重上述技術(shù)在金融等領(lǐng)域的應用。必修課在講授統(tǒng)計基礎(chǔ)理論(描述、多元、時序、空間、可視化等)課程的基礎(chǔ)上,為增強學生的大規(guī)模分布式計算技能,引入主流的大數(shù)據(jù)計算平臺,如Hadoop分布式平臺、MapReduce并行編程算法。與此同時,為提高學生動手能力,構(gòu)建數(shù)據(jù)模型思維,開設(shè)《大數(shù)據(jù)分析案例》等多門課程。選修課方面,考慮到學生二次開發(fā)的需要,設(shè)置大數(shù)據(jù)開發(fā)基礎(chǔ)課程,如C++、Java等。為突出應用統(tǒng)計專業(yè)碩士側(cè)重應用的特點,開設(shè)面向數(shù)據(jù)的編程語言,如R、SAS、Python等課程。這些課程模塊的設(shè)置并非體現(xiàn)某一學科知識的縱深發(fā)展,而是將相關(guān)學科的知識融合,有利于突出大數(shù)據(jù)分析的特點。
3.2 創(chuàng)新教學培養(yǎng)模式,注重培用結(jié)合
以“編組”方式開展教學活動。授課教師和學生均采用團隊編組模式,多名教師協(xié)同工作,共同完成一門課程的授課任務。打破原有學科思維、教材的束縛。采用導師指導與集體培養(yǎng)相結(jié)合的方式。教師不可照搬舊有的教學大綱、課程內(nèi)容,要學習和熟悉大數(shù)據(jù)相關(guān)知識體系與技術(shù)新進展,充分結(jié)合大數(shù)據(jù)分析需求和實際案例,使課程內(nèi)容緊貼實際需求,注重培養(yǎng)學生對模型的理解,對數(shù)據(jù)的想象力,真正實現(xiàn)學以致用、培用結(jié)合。
采取“訂制化”培養(yǎng)模式,突出培養(yǎng)與應用相結(jié)合的特點,力爭做到人、崗的高度匹配?!坝喼苹迸囵B(yǎng)模式打破了目前應用統(tǒng)計專業(yè)碩士統(tǒng)一培養(yǎng)、與市場需求脫節(jié)的模式壁壘,教學實踐以市場需求為導向,依照企業(yè)的崗位標準、用人要求,強調(diào)以崗位需求制定培養(yǎng)方案,更好地滿足用人單位對大數(shù)據(jù)分析人才的需求。
3.3 開展校企協(xié)同培養(yǎng),構(gòu)建問題導向、項目牽引的實踐教學模式
根據(jù)國務院學位委員會的規(guī)定,應用統(tǒng)計學專業(yè)碩士學位研究生教育的目的是培養(yǎng)具有良好的統(tǒng)計學背景,系統(tǒng)掌握數(shù)據(jù)采集、處理、分析和開發(fā)的知識與技能,具備熟練應用計算機處理和分析數(shù)據(jù)的能力,能夠并適應行業(yè)或職業(yè)實際工作需要的應用型高層次人才。因此,要摒棄普遍存在的重理論輕實踐、重知識輕技能的教學方式。
協(xié)同創(chuàng)新培養(yǎng)在實踐教學中建立了以問題為導向,以項目為牽引的運作機制,強調(diào)實踐教學內(nèi)容的呈現(xiàn)方式要面向企業(yè)需求,讓學生參與到企業(yè)的項目運行過程中,引導學生建立業(yè)務建模能力,培養(yǎng)學生的數(shù)據(jù)資源整合能力,激發(fā)學生參與項目的積極性和自覺性。學生不拘泥于學校的實驗實訓基地和各類實驗室,在第二學年中安排一定時間走出校門,進入到企業(yè)的實際環(huán)境中,參與企業(yè)的項目組織、實施過程,在實踐過程中提升自我認知能力,在實踐過程應用知識和理論研究實際問題的能力,培養(yǎng)和鍛煉數(shù)據(jù)資源整合能力、溝通協(xié)調(diào)能力、IT支撐能力、業(yè)務建模能力,真正實現(xiàn)面向能力培養(yǎng)的目的。指導教師方面,在案例教學和實習階段引進業(yè)務素質(zhì)高、項目經(jīng)驗豐富、對大數(shù)據(jù)發(fā)展有敏銳洞察力的企業(yè)高級數(shù)據(jù)分析人員,指導學生在實習實踐中提出問題、建立模型、解決問題的能力。
4 結(jié)語
應用統(tǒng)計(大數(shù)據(jù)分析)專業(yè)碩士人才協(xié)同培養(yǎng)模式,是一項可持續(xù)發(fā)展的應用統(tǒng)計專業(yè)碩士人才培養(yǎng)的新模式,是專業(yè)碩士教學實踐的創(chuàng)新舉措,也是在全國率先建立起來的立足統(tǒng)計學,在大數(shù)據(jù)分析人才層面建立的校校協(xié)同、校企系統(tǒng)辦學體。體現(xiàn)了面向能力培養(yǎng)、面向社會需求培養(yǎng)、面向人才價值培養(yǎng)的“三個面向”的培養(yǎng)目標,著重培養(yǎng)學生分析數(shù)據(jù)、處理數(shù)據(jù)、展示數(shù)據(jù)的能力,對于培養(yǎng)“高層次、實用性、復合型、國際化”大數(shù)據(jù)分析人才意義重大,同時也是順應大數(shù)據(jù)技術(shù)革命的浪潮,必將對大數(shù)據(jù)等新興技術(shù)產(chǎn)業(yè)的發(fā)展注入活力。
(首都經(jīng)濟貿(mào)易大學,北京 100070)
參考文獻:
[1]劉軍.Hodoop大數(shù)據(jù)處理[M].人民郵電出版社,2013.
[2]大數(shù)據(jù)的四個典型特征[N].中國電子報、電子信息產(chǎn)業(yè)網(wǎng),2012(12).
[3]CCF大數(shù)據(jù)專家委員會.2014年大數(shù)據(jù)發(fā)展趨勢預測[J].中國計算機學會通訊,2014(1):32-36.
[關(guān)鍵詞]新媒體營銷;企業(yè)轉(zhuǎn)型升級;市場營銷模式
1引言
新媒體營銷是隨著互聯(lián)網(wǎng)技術(shù)不斷發(fā)展而衍生的重要產(chǎn)物,它是以移動平臺為載體,以信息技術(shù)為橋梁而實現(xiàn)的企業(yè)網(wǎng)絡市場競爭的過程。這種模式的出現(xiàn)意味著企業(yè)與現(xiàn)代科學技術(shù)的接軌,是企業(yè)智能化數(shù)據(jù)化發(fā)展的鮮明體現(xiàn)。企業(yè)在新媒體平臺和技術(shù)的指導下,能夠依靠各類先進技術(shù),轉(zhuǎn)變自身的發(fā)展方式。其中最為突出的應用便在于企業(yè)對數(shù)據(jù)分析的引進。
2分析數(shù)據(jù),確立市場受眾群體
企業(yè)要想在眾多新媒體平臺營銷中脫穎而出,就必須掌握符合自身市場定位的消費群體,要讓自身生產(chǎn)的產(chǎn)品能夠有廣泛的接受度,要取得屬于自身獨有的市場信任感和公信力。這也就意味著企業(yè)要主動出擊,積極地吸引消費者群體的關(guān)注和重視。如果一個企業(yè)發(fā)展自身新媒體營銷的方法,僅僅是通過水軍或者是買來的粉絲,或者是通過轉(zhuǎn)發(fā)抽獎等,那么這個企業(yè)只會在短時間內(nèi)取得一定的爆發(fā)式關(guān)注,無法取得長遠的市場利益,也沒有辦法真正的給消費者留下深刻的印象,自然也不能根據(jù)消費者的喜好和興趣制訂出針對性的市場營銷方案。這就需要企業(yè)通過數(shù)據(jù)分析的方法來明確自身的受眾群體。[1]首先,企業(yè)要用數(shù)據(jù)分析的方法,對自身已有的市場發(fā)展基礎(chǔ)進行系統(tǒng)的分析和總結(jié),整理出自身的市場定位和發(fā)展特點,包括品牌形象、競爭優(yōu)勢、產(chǎn)品性質(zhì)等。在此基礎(chǔ)上,大致地規(guī)劃消費者的群體范圍,制訂相應的宣傳方案和宣傳規(guī)劃,同時也要注意把握時間的限制,要盡可能地尋求時間和效益之間的平衡。在這一過程中,企業(yè)要按照消費者的點擊喜好和頻率,來制定有針對性的宣傳模式,這樣可以更為有效地吸引消費者的關(guān)注。其次,企業(yè)要重視用戶之間的傳播和轉(zhuǎn)發(fā),企業(yè)要在吸引一批粉絲的基礎(chǔ)上適當?shù)剡M行轉(zhuǎn)發(fā)和抽獎活動,擴大自身的市場影響力。最后,企業(yè)也要在這一過程中精確自身的市場定位,要動態(tài)地觀察宣傳的成果和績效,要尋找大眾的認同感。這便要求企業(yè)要借助數(shù)據(jù)分析和檢索的平臺,搜索與自身宣傳相關(guān)的信息確立關(guān)鍵詞和重點語句,并分析大眾對于自身的評價和看法,更好地改進營銷中存在的缺陷和不足。同時要在此基礎(chǔ)上,讓自身的宣傳內(nèi)容更加量化和準確,更好地提升在用戶之間的口碑。
3分析數(shù)據(jù),確立市場營銷載體
根據(jù)上文所述,企業(yè)在新媒體營銷中所進行的宣傳是離不開固定的平臺和載體的,移動平臺是企業(yè)信息和展現(xiàn)自身形象的基礎(chǔ)與保障。因此,企業(yè)要十分重視自身新媒體營銷工具的選擇,要運用數(shù)據(jù)分析的方法精準地統(tǒng)籌和管理市場營銷的信息,推動網(wǎng)絡營銷能夠適應自身發(fā)展的特點和規(guī)律。同時,數(shù)據(jù)分析方法還可以把企業(yè)自身經(jīng)營的特點與不同的新媒體平臺進行融合,對比其結(jié)合后的實際效益和成果,同時也可以與事先的市場規(guī)劃設(shè)計相比較,在此基礎(chǔ)上選擇最為合適的企業(yè)新媒體營銷載體。[2]之所以運用數(shù)據(jù)分析的方法來選擇企業(yè)新媒體營銷載體,是因為現(xiàn)階段網(wǎng)絡企業(yè)的發(fā)展形式多種多樣,不同的企業(yè)也有自身不同的市場定位和產(chǎn)品特點,彼此之間相互獨立,但是也緊密聯(lián)系。這也就意味著,各類企業(yè)在共同運用新媒體網(wǎng)絡平臺這一方法進行市場營銷的同時,也要根據(jù)自身的發(fā)展特點來選擇適合自己的宣傳載體和工具,只有這樣才可以促進宣傳內(nèi)容的有效傳播。當下企業(yè)利用新媒體進行宣傳的主要形式包括紀錄片、文字和圖像等,也可以是多種表現(xiàn)形式的結(jié)合。盡管在宣傳方式上具有多樣性,但是否能真正的起到吸引用戶的作用還需要依靠用戶的主觀能動性。這就要求企業(yè)在選擇好自身營銷載體的基礎(chǔ)上,利用后臺運行接收數(shù)據(jù)信息的方法,分析用戶點擊頻率最多的板塊和內(nèi)容,總結(jié)出現(xiàn)階段自身市場發(fā)展應當跟隨的主流趨勢,以及分析當下營銷平臺運行的成果。例如當下的微博小程序,就是企業(yè)依靠文字推送或者視頻的方式,與用戶建立線上的交流和溝通,在此基礎(chǔ)上根據(jù)用戶的點擊頻率來制訂出更有針對性的市場營銷方案。
4分析數(shù)據(jù),確立信息展示模式
現(xiàn)階段,有許多企業(yè)建立了自身運營的自媒體平臺,有相當一部分是需要用戶下載相應的軟件,并注冊賬號才可以獲得相關(guān)的信息。用戶在注冊之后,便可以通過在移動端登錄的方法來完成后續(xù)操作。[3]但也正是因為這種登錄方法的存在,用戶會獲得比其他平臺更多的市場信息。這就在一定程度上激發(fā)了用戶的厭煩心理,有相當一部分用戶會由于時間的限制,直接略過企業(yè)所的信息。同時,也有一部分企業(yè)將自身的信息運用網(wǎng)頁鏈接或者是二維碼的方式展現(xiàn)出來,用戶必須要在登錄網(wǎng)站的基礎(chǔ)上再一次點開網(wǎng)頁鏈接,這就會讓用戶覺得瀏覽信息是一件非常煩瑣的事情。因此,企業(yè)要重視自身信息展現(xiàn)形式的轉(zhuǎn)變,企業(yè)要盡可能地選擇簡潔明了的形式突出自身信息的重點,要讓用戶可以看到自身營銷的優(yōu)勢和特點。企業(yè)可以用數(shù)據(jù)分析的方法,統(tǒng)計出用戶容易接受的信息展現(xiàn)形式,并按照類別進行劃分。當下,用戶容易接納的是企業(yè)圖文并茂的信息展現(xiàn)形式,可以是圖片和文字鏈接的結(jié)合,也可以是視頻和文字鏈接的結(jié)合,或者是將鏈接安置在圖片上。企業(yè)就可以根據(jù)用戶的喜好,將自身內(nèi)容展現(xiàn)的形式進行改革和優(yōu)化,例如企業(yè)可以將市場經(jīng)營的方向和產(chǎn)品的性能,利用形象化的圖片展示出來。讓用戶可以一眼就看到自身的品牌特色,提高自身的吸引力。在這一過程中企業(yè)要意識到信息真實準確表達的重要性,企業(yè)可以在原有的基礎(chǔ)上進行適當?shù)劁秩竞蜐櫳?,但是不能虛假信息,不能夸大其詞,不能讓用戶接受錯誤且夸張的市場營銷數(shù)據(jù)。
5分析數(shù)據(jù),確定市場發(fā)展價值
企業(yè)運用數(shù)據(jù)分析的重點不僅是要打造更為針對性的市場營銷方案,更是要在數(shù)據(jù)信息的分析過程中審視自身的市場經(jīng)營價值,分析自身的發(fā)展建設(shè)前景,評估現(xiàn)階段自身方案的質(zhì)量和效益,并以此來為未來的長遠發(fā)展打下堅定的基礎(chǔ)。因此企業(yè)要用數(shù)據(jù)分析的方法,對自身新媒體運營平臺進行階段性和周期性的監(jiān)督,分析現(xiàn)階段自身在市場競爭中的地位。[4]監(jiān)督的內(nèi)容主要包括平臺粉絲的瀏覽量和點擊率、粉絲的轉(zhuǎn)發(fā)量、粉絲總量的增減、除粉絲之外的市場其他用戶點擊率,以及現(xiàn)階段市場營銷的經(jīng)濟利潤和收益等。這樣就可以在很大程度上幫助企業(yè)確定自身營銷平臺選擇的正確性,分析自身市場發(fā)展定位的準確性。
為了進一步了解館藏圖書的利用情況,現(xiàn)從社科類、自科類及綜合類的角度對2008年—2012年5年數(shù)據(jù)進行結(jié)構(gòu)劃分,其中社科類包含《中圖法(第四版)》中的A-K類,自科類包含N-X類,綜合類指Z類。綜合類每年的購置量很少,此次在表2中體現(xiàn),僅供參考,重點將社科與自科類圖書進行分析。從館藏冊數(shù)方面,由表2的數(shù)據(jù)統(tǒng)計得知自科類圖書占據(jù)主導地位,分別占到55%,54.5%,56%,54.5%,56.2%,這與圖書館每年制定的自科社科6:4的圖書入藏比例基本相符,也表明了圖書館的館藏結(jié)構(gòu)符合學校以工為主的辦學特色。流通比例是指圖書的借閱量與總的借閱量的比例,可以從很多方面進行劃分,時間段內(nèi)讀者對各類圖書的整體需求比例,從類別結(jié)構(gòu)劃分流通比例就可以客觀的反映出來。由表2的數(shù)據(jù)統(tǒng)計得知,2008年—2012年,社科類的流通比例每年都高于自科類,分別占到了56%,58%,60%,57%,66%。
入藏比例與流通比例的分析比對
取自科與社科的入藏比例和流通比例的差值Z,以數(shù)值0為分界點,分為正負兩個區(qū)間,如果Z值落在同區(qū)間內(nèi),則表示館藏圖書與讀者需求在整體上保持一致,反之,若Z值落在不同的區(qū)間,則表示館藏圖書與讀者需求存在矛盾。計算公式Z=X-YX:入藏比例Y:流通比例如圖1所示,圖書館5年內(nèi)的Z值均分布于兩個不同的區(qū)間,從而說明,入藏的圖書與讀者的需求存在出入,沒有達到一致。那么,為了使圖書更好的被利用,是應該繼續(xù)按照圖書館原有的采購比例繼續(xù)采購,還是要改變采購方向迎合讀者的需求,就要進一步的了解利用率較高的幾大類圖書。
文獻的利用率衰減對文獻采購的影響
1圖書利用率的分類排名
通過統(tǒng)計,借閱率排名前10位的有文學(I)、哲學(B)、藝術(shù)(J)、語言、文字(H)、社科總論(C)、歷史、地理(K)、經(jīng)濟(F)、工業(yè)技術(shù)(T)、政治法律(D)、數(shù)理科學和化學(O)。以2008年入藏的中文圖書作為統(tǒng)計對象,以2008年—2012年5年作為5個借閱時間段,前10位的借閱率統(tǒng)計結(jié)果如表3。表3的統(tǒng)計結(jié)果清晰表明,在每年的借閱率排名前10類中,社科類占到了80%,而自科類只占到了20%,社科類中文學(I)的借閱率更是高居榜首,文學類圖書受到讀者的歡迎,在其他各個高校中的借閱率排名亦是居高不下。社科類更是占據(jù)了借閱率排行的前6位。自科類排名中T大類遙遙領(lǐng)先,這是由于工業(yè)技術(shù)本身就涵蓋了TB、TD、TM等眾多類別,受眾面較為廣泛,但與社科類的圖書利用率進行比較,自科類的圖書利用率還是有一定的差距。一個圖書情報機構(gòu)是為某一個或幾個專業(yè)研究、教育培訓服務,還是為一般參考咨詢或娛樂欣賞服務,這是設(shè)計藏書結(jié)構(gòu)的基本出發(fā)點和目標[2]。西安理工大學屬于理工院校,以工為主亦應該在圖書館館藏結(jié)構(gòu)中得以體現(xiàn)。
2文獻利用率的衰減分析
文獻可看作是一種信息,信息有其時效性,文獻的價值也會隨著時間的流逝而逐漸降低(特種文獻除外)[3],圖書的利用率也符合這種規(guī)律逐年衰減。這一點可從表3的各類圖書的年利用率中清晰看到。文學(I)從91.19%降至47.70%,其它各類圖書都有不同程度的降低。如果用U來表示圖書利用率的衰減程度,那么U就應該等于同樣的入藏圖書大類在不同時間段內(nèi)的借閱率之差。U的值越大,說明該類圖書利用率的衰減程度大,利用價值損耗大,反之,說明該類圖書的利用價值時間長,采購圖書時應加以考慮。2008年入藏的圖書,在2008年的借閱率與2012年的借閱率之差結(jié)果如圖2所示。其中U值較小的為T類與O類,I類排在第4位。自科類的圖書利用率雖然較低,但是,隨著時間的推移,自科類的圖書利用率衰減值小,所以利用價值可持續(xù)的周期比較長,可供讀者的參考價值也較高。社科類的圖書借閱率較高,但是時效性低,而且衰減值高,圖2中顯示,J類,H類,C類,F(xiàn)類的借閱率之差相當,而且數(shù)值較高,I類圖書借閱率最高,但是屬于非專業(yè)圖書,應控制采購比例。2008年入藏的圖書,5年之后,2012年的利用率排名前3位的分別為文學(I)47.70%、哲學(B)47.62%、工業(yè)技術(shù)(T)40.90%。T與O大類的借閱率排名分別從第8位與第10位上升為第3位與第6位。這說明自科類的圖書保值期比社科類圖書時間長,例如2008年購置的自科類《電子線路CADProtel99SE》一書,在2008年流通量為6次,2012年仍然流通量4次,而社科類《經(jīng)濟學的分析方法》一書,2008年的流通量為11次,在2012年就只流通了1次。
關(guān)鍵詞: 數(shù)據(jù)挖掘;數(shù)據(jù)倉庫;相關(guān)分析
中圖分類號:TP 311.3 文獻標志碼:A 文章編號:1672-8513(2011)03-0182-03
The Application of Correlation Analysis Algorithms in the Data Invites Chien
ZHANG Hanyun,DUAN Peng
(School of Mathematics and Computer Science,Yunnan University of Nationalities,Kunming 650031,China)
Abstract: The data warehouse was constructed by using the mass data of computer science majors’ scores generated during the past three years in thirteen classes of four grades, we analyze the corresponding degree of different courses in the database using corresponding analyzing techniques, and condense the attributes in database according to corresponding factors, An example is given to illustrate the application of the proposed method. The analysis introduced in the paper has provided a scientific basis for improving the teaching quality .Then it is prepare for the Association rules mined of different courses.
Key words: data mining;data warehouse; correlation analysis
相關(guān)分析法是在分析某個問題或指標時,將與該問題或指標相關(guān)的其他問題或指標進行對比,分析其相互關(guān)系或相關(guān)程度的一種分析方法,用少數(shù)幾對綜合變量來反映2組變量間的線性相關(guān)性質(zhì).目前它已經(jīng)在眾多領(lǐng)域的相關(guān)分析和預測分析中得到廣泛應用.本文主要研究如何利用相關(guān)分析技術(shù)產(chǎn)生計算機專業(yè)課之間的相關(guān)系數(shù),發(fā)現(xiàn)專業(yè)課程之間的相關(guān)度,對數(shù)據(jù)倉庫中的數(shù)據(jù)進行約簡[1].
1 相關(guān)分析
1.1 相關(guān)分析概述[2]
相關(guān)分析(Correlation Analysis)是研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法.相關(guān)關(guān)系是一種非確定性的關(guān)系,例如,以X和Y分別記一個人的身高和體重,或分別記每公頃施肥量與每公頃小麥產(chǎn)量,則X與Y顯然有關(guān)系,而又沒有確切到可由其中的一個去精確地決定另一個的程度,這就是相關(guān)關(guān)系.例如,教育投資與教育發(fā)展速度的關(guān)系、教師教學水平和學生的學習效果之間的關(guān)系等[3].
相關(guān)系數(shù)值為-1(完全負相關(guān)關(guān)系)~+1(完全正相關(guān)關(guān)系)之間,相關(guān)系數(shù)為0時,表示不存在相關(guān)關(guān)系.例:
正相關(guān):學生的學習能力與學習成績的關(guān)系;
負相關(guān):教師的身體狀況與缺勤率的關(guān)系;
零相關(guān):教師的身高與教學能力的關(guān)系.
Pearson相關(guān)用于雙變量正態(tài)分布的資料,其相關(guān)系數(shù)稱為積矩相關(guān)系數(shù)(Coefficient of Product-Moment Correlation).進行相關(guān)分析時,我們一般會同時對2變量繪制散點圖,以更直觀地考察2變量之間的相互變化關(guān)系[4].
用Flag Significant Correlations 進行顯著性檢驗,標出有顯著性意義的相關(guān)系數(shù),用一個星號“*”標記在α=0.05水平上有顯著性意義的相關(guān)系數(shù);用2個星號“**”標記在α=0.01水平上有顯著性意義的相關(guān)系數(shù)[5].
1.2 相關(guān)分析的表示方法
進行相關(guān)分析的主要方法有圖示法和計算法.圖示法是通過繪制相關(guān)散點圖來進行相關(guān)分析,計算法則是根據(jù)不同類型的數(shù)據(jù),選擇不同的計算方法求出相關(guān)系數(shù)來進行相關(guān)分析.
1.2.1 圖示法
圖示法的具體做法就是繪制相關(guān)散點圖.相關(guān)散點圖是觀察2個變量之間關(guān)系的一種非常直觀的方法.具體繪制的方法是:以橫軸表示2個變量中的1個變量(作為自變量),以縱軸表示另一個變量(作為因變量).將2個變量之間相對應的變量值以坐標點的形式逐一標在直角坐標系中,通過點的分布形狀和疏密程度來形象描述2個變量之間的相關(guān)關(guān)系.
相關(guān)散點圖可以通過手工繪制而得到.但如果面對的變量值比較多,手工繪制的過程既費時,又不夠精確.
1.2.2 計算法
相關(guān)系數(shù)也稱為相關(guān)量,是用來描述變量之間變化方向和密切程度的數(shù)字特征量,一般用r表示.它的數(shù)值范圍在-1到+1之間,它的正負號反映變量之間變化的方向;它的絕對值的大小反映變量之間關(guān)系的密切程度.
根據(jù)2個變量變化的密切程度,我們把相關(guān)關(guān)系分為完全相關(guān)、高度相關(guān)、中度相關(guān)、低度相關(guān)、零相關(guān)[6].
完全相關(guān):│r│=1的相關(guān);
高度相關(guān)或強相關(guān):0.7≤│r│<1的相關(guān);
中度相關(guān):0.4≤│r│<0.7的相關(guān);
低度相關(guān)或弱相關(guān):│r│<0.4的相關(guān).
1.3 Pearson相關(guān)
Pearson相關(guān)也稱積差相關(guān),積差相關(guān)也稱積矩相關(guān),是英國統(tǒng)計學家Rearson提出的一種計算直線相關(guān)的方法,因而又稱為Rearson相關(guān)[6-7].
積差相關(guān)系數(shù)是2列成對觀測值中各對觀測值的標準分數(shù)乘積之和除以觀測值對數(shù)所得之商[8].
1.3.1 Pearson相關(guān)的使用條件
1) 2個變量之間是線性關(guān)系,都是連續(xù)數(shù)據(jù);
2) 2個變量的總體是正態(tài)分布,或接近正態(tài)的單峰分布;
3) 2個變量的觀測值是成對的,每對觀測值之間相互獨立.
1.3.2 Pearson相關(guān)的計算公式
r=∑ZXZYn=∑X-Y-nσXσY.
式中,[ZK(]n表示數(shù)據(jù)的對數(shù);σX,σY分別表示X和Y變量的樣本標準差;[JP],分別表示X和Y變量的樣本平均數(shù).[ZK)]
對于學生成績,其課程總體分布接近正態(tài)分布,滿足Pearson相關(guān)的使用條件.在統(tǒng)計軟件SPSS中,可以很方便地得出2變量之間的Pearson相關(guān)系數(shù).[JP]
2 用相關(guān)分析法進行數(shù)據(jù)約簡
2.1 學生成績數(shù)據(jù)倉庫的建立
數(shù)據(jù)選擇上,主要選擇了作者所在學校計算機專業(yè)3年來產(chǎn)生的專業(yè)基礎(chǔ)課成績,收集并整理了包含高等數(shù)學、C語言、數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)庫系統(tǒng)原理的504條學生成績數(shù)據(jù).并將具體的成績數(shù)據(jù)離散化為4個等級[9],即:
成績>=80“A”; 70=
2.2 用相關(guān)分析法進行數(shù)據(jù)約簡
對大規(guī)模數(shù)據(jù)庫內(nèi)容進行復雜的數(shù)據(jù)分析通常需要耗費大量的時間,這就常常使得這樣分析變得不現(xiàn)實和不可行,尤其是需要交互式數(shù)據(jù)挖掘時.數(shù)據(jù)約簡技術(shù)正是用于幫助從原有龐大數(shù)據(jù)集中獲得一個精簡的數(shù)據(jù)集合,并使這一精簡數(shù)據(jù)集保持原有數(shù)據(jù)集的完整性,這樣在精簡數(shù)據(jù)集上進行數(shù)據(jù)挖掘,顯然效率更高,并且挖掘出來的結(jié)果與使用原有數(shù)據(jù)集所獲得結(jié)果基本相同[10].
數(shù)據(jù)約簡并不是一個新的領(lǐng)域,現(xiàn)在已經(jīng)提出了很多理論和方法,如:層次分析法,主成分分析法,隨機抽樣、免疫算法等.本研究根據(jù)實際需要,提出將相關(guān)分析方法應用于學生成績的屬性約簡,即方便快捷又不失理論性.
在SPSS軟件中,畫出計算機專業(yè)課高等數(shù)學成績的直方圖,如圖1.
用同樣的方法,可以畫出其他計算機專業(yè)課如C語言、數(shù)據(jù)結(jié)構(gòu)等的直方圖,可以看出,我們所建立的數(shù)據(jù)倉庫中,學生計算機專業(yè)課程成績基本上符合正態(tài)分布,滿足Pearson相關(guān)的使用條件.
我們用雙變量相關(guān)分析技術(shù)來分析相關(guān)課程之間的關(guān)聯(lián)程度,并做出統(tǒng)計學推斷,以最少的數(shù)據(jù)量反映最大的信息量,進而對數(shù)據(jù)庫的屬性進行約簡.通過相關(guān)分析約簡相關(guān)性較弱的屬性,選擇相關(guān)性強的屬性而不直接利用數(shù)據(jù)庫中的所有屬性,從而減少大量冗余屬性,以提高算法的效率.
在SPSS中進行課程間Pearson相關(guān)系數(shù)分析,得到計算機專業(yè)課程相關(guān)系數(shù)分析表如表1.
1:表中數(shù)值為4門課程進行相關(guān)分析得到的皮爾遜相關(guān)系數(shù)(Pearson Correlation)、相伴概率(Sig.(2-tailed))、樣本個數(shù)(N).“*”標記在α=0.05水平上有顯著性意義的相關(guān)系數(shù);用兩個星號“**”標記在α=0.01水平上有顯著性意義的相關(guān)系數(shù);
2:相伴概率用來判斷求解線性關(guān)系的兩變量之間是否有明顯的線性關(guān)系.一般將這個Sig值與0.05相比較,如果它大于0.05,說明平均值在大于5%的幾率上是相等的,而在小于95%的幾率上不相等;如果它小于0.05,說明平均值在小于5%的幾率上是相等的,而在大于95%的幾率上不相等;如C語言與數(shù)據(jù)結(jié)構(gòu)的Sig是0,此數(shù)值說明C語言與數(shù)據(jù)結(jié)構(gòu)有顯著的線性關(guān)系(因為Sig0.05,則說明兩變量之間沒有明顯的線性關(guān)系).
由表1可以看出,同一門課程之間的Pearson相關(guān)系數(shù)為1,是完全相關(guān)關(guān)系.高等數(shù)學與C語言之間的Pearson相關(guān)系數(shù)為0.283,C語言與數(shù)據(jù)結(jié)構(gòu)之間的Pearson相關(guān)系數(shù)為0.281,數(shù)據(jù)結(jié)構(gòu)與數(shù)據(jù)庫系統(tǒng)原理之間的Pearson相關(guān)系數(shù)為0.565,并且都有“*”標記,由此可以推斷這4組課程之間有顯著性意義的相關(guān)性.
3 結(jié)語
用相關(guān)分析技術(shù)對數(shù)據(jù)庫進行約簡,結(jié)果表明:線性代數(shù)、計算機導論及Pascal語言等多個因素相關(guān)性較弱;而C語言、數(shù)據(jù)結(jié)構(gòu)、高等數(shù)學及數(shù)據(jù)庫系統(tǒng)原理之間相關(guān)性較強,根據(jù)數(shù)據(jù)庫約簡原則,可將線性代數(shù)、計算機導論及Pascal語言等多個屬性項從數(shù)據(jù)庫中刪除,以便提高數(shù)據(jù)挖掘效率.
參考文獻:
[1]段西凌,甘開鵬.數(shù)據(jù)挖掘在人口普查信息系統(tǒng)中的應用[J].云南民族大學學報:自然科學版,2006,15(2):170-172.
[2]茆詩松.統(tǒng)計手冊[M].北京:科學出版社,2003.
[3]TANG Zhaohui,MACLENNAN J.數(shù)據(jù)挖掘原理與應用[M]. 鄺祝芳,焦賢龍,高升,譯.北京:清華大學出版社,2007.
[4]王艷.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的探討[J].成都信息工程學院學報,2004,19(2):173.
[5]張儒良,王翰虎.論數(shù)據(jù)挖掘優(yōu)化教學管理[J].貴州民族學院學報,2004:133.
[6]趙輝.數(shù)據(jù)挖掘技術(shù)在學生成績中分析中的應用[D].大連:大連海事大學,2007.
[7]王月敏.基于遺傳算法的智能組卷系統(tǒng)研究[J].云南民族大學學報:自然科學版,2009,18(2):173-176.
[8]劉利鋒,吳孟達. 關(guān)聯(lián)規(guī)則的快速提取算法 [J].計算機工程.2008,34(5):63-65.
[9]李萍,段富.數(shù)據(jù)挖掘中數(shù)據(jù)約簡的研究與應用[J].微計算機應用.2009,25(2):58-60.[ZK)]
[10][ZK(#]蔡勇,韓永國,劉自偉.數(shù)據(jù)挖掘技術(shù)在生源分析中的應用研究[J].計算機應用研究.2004,32(6):48-51.
收稿日期:2010-09-06.
【關(guān)鍵詞】大數(shù)據(jù)時代;運動訓練科學;研究方向
引 言
運動訓練科學的基本理論在1960至1970年基本形成,而研究則在1990年后正式開始。運動訓練科學屬于自然科學尤其是數(shù)學、化學、物理學、生物學、生理學等科學的產(chǎn)物。傳統(tǒng)的運動訓練科學遵循的是小數(shù)據(jù)研究理念與模式,然而,隨著大數(shù)據(jù)的到來,小數(shù)據(jù)所展現(xiàn)出來的碎片化、分散化的特點不能完全的反映運動訓練的模式,而大數(shù)據(jù)的分析存儲、收集、使用數(shù)據(jù)的能力則在運動訓練科學中逐漸應用。從訓練人員身上的傳感器、可穿戴設(shè)備以及場內(nèi)的攝像頭,再到服務人員手中的互聯(lián)網(wǎng)以及終端設(shè)備,這其中大量的數(shù)據(jù)已經(jīng)被收集起來,進而為以后的訓練服務應用。不論是受傷運動員的訓練還是教練的戰(zhàn)術(shù)布置,都已經(jīng)更加完整已經(jīng)呈現(xiàn)在我們面前。可見在大數(shù)據(jù)時代的到來,為運動訓練科學提供了重要的幫助。也為運動訓練科學領(lǐng)域注入了新的生機與活力,推動其在科學化研究和運動訓練現(xiàn)代化研究的發(fā)展,解決了在運動訓練中許多遺留下來的問題,并且提供了新的研究方法思路,為運動訓練科學開辟了一條新的研究道路。
一、大數(shù)據(jù)時代下運動訓練科學的研究現(xiàn)狀
在大數(shù)據(jù)的背景下,不論是運動員的恢復、預防或傷病,運動競賽的過程,運動的訓練的評價和效果,還是在競賽過程中的戰(zhàn)術(shù)分析與安排、運動員的選材、運動訓練的時間等都與大數(shù)據(jù)有著緊密地聯(lián)系。因此,在大數(shù)據(jù)時代下如何從眾多的數(shù)據(jù)中尋找在運動訓練中各種數(shù)據(jù)之間的聯(lián)系,發(fā)現(xiàn)隱藏在運動之中的秘密,從而準確的為運動員或者在訓練中提供有效的數(shù)據(jù),幫助運動員到達合理的身體狀態(tài)與競賽成績是對運動訓練科學是極為必要的。如今大的數(shù)據(jù)的出現(xiàn)幫助在田徑、游泳、籃球、足球、棒球、羽毛球等運動提供了一定的數(shù)據(jù)支持,為競技賽場增添了一絲色彩,潛移默化的改變著運動訓練科學領(lǐng)域的認知。
高爾夫球運動受到了各國運動員的喜愛,如今運動員也正是依靠數(shù)據(jù)分析來幫助他們在技術(shù)方面、訓練方面更加全面,以此提高他們的訓練成績。例如Track Man技術(shù)是幫助運動員測量在每次擊球后的擊球方向、旋轉(zhuǎn)速度、角度和力度等,然后通過數(shù)據(jù)軟件等進行分析,幫助運動員了解自己的數(shù)據(jù)之后,更加針對性的進行訓練。在上個世紀八十年代,美國男子職業(yè)籃球聯(lián)賽就通過數(shù)據(jù)來展示運動員在場上的得分、進攻、掩護、擋拆、對抗數(shù)據(jù),經(jīng)過近四十年的數(shù)據(jù)積累,裁判可以根據(jù)比賽回放等來進行更好的判斷,教練也可以利用數(shù)據(jù)對戰(zhàn)術(shù)進行分析安排。截至目前為止,凡是聘請了數(shù)據(jù)分析師的球隊俱樂部平均勝率都打到六成以上,而其他俱樂部僅有40%的勝率。在某些運動中運動員可以通過佩戴傳感器來檢測運動員的心率、垂直彈跳以及加速度等,從而保障運動員的生命安全,并且制定相應的訓練,提高運動員的運動能力。
在德國,每一個足球場地四周布置傳感器,甚至在每位球員的訓練中也都放置了傳感器來對運動員的運動變化細節(jié)進行分析。這些數(shù)據(jù)會在很短的時間內(nèi)傳到終端平臺中,有由教練對這些運動員的運動軌跡、攻擊范圍以及運球的速率等相關(guān)信息進行戰(zhàn)術(shù)分析;在網(wǎng)球的訓練中,也有許多場地安置了傳感器來捕捉網(wǎng)球的發(fā)球速率、旋轉(zhuǎn)、發(fā)球角度等來判斷球員的打法、擊球特點。為戰(zhàn)術(shù)的安排提供強有力的數(shù)據(jù)支持。而運動員的發(fā)球失誤率以及非受迫性失誤上升時,教練則會判斷球員的體力或者心理狀態(tài)不足。除了這兩項運動外,乒乓球、羽毛球、棒球等都通過這種獨特的數(shù)據(jù)方式來幫助球隊以最小的經(jīng)濟利益獲取成功,從而提高運動員的比賽成績。
二、大數(shù)據(jù)背景下運動訓練科學的研究方向
(一)明確運動科學訓練研究對象
在大數(shù)據(jù)背景下要想確定運動訓練科學的研究方向,首先要明確習研究對象。而我國近代運動訓練科學是一種實體的研究,不依賴于其他事物外部復雜的實體。而在實體的研究中主要利用分解還原的研究方法,在數(shù)據(jù)的研究模式采用小數(shù)據(jù)研究。例如,在競技體育中將各項競技因素分開,單獨訓練體力或者技術(shù),并且以彈跳力能力、心率肺活量、肌肉圍度等指標來確定運動員的能力。然而,在運動訓練科學的研究表明,實體是依附于關(guān)系的,關(guān)系甚至比實體更加重要。例如,核算與蛋白質(zhì)相互作用產(chǎn)生生命,原子之間相互作用而產(chǎn)生分子。故而,對于訓運動訓練科學來說,關(guān)系要比實體更加重要。如果我們能在運動訓練科學中找到這些信息之間的聯(lián)系,就能準確的分析在運動訓練中的技巧與對策,從而提高運動員運動訓練的效率。
(二)明確運動訓練研究視角
我國近現(xiàn)代運動科學訓練都是單向度,如研究運動技術(shù)或者運動員的生理機能等。我國運動訓練科學的研究方向首先要由單向度多向度發(fā)展,促進運動訓練科學的有效進行。
結(jié)語
綜上所述,大數(shù)據(jù)時代的到來為我國運動訓練科學研究領(lǐng)域帶來了新的機遇。我們需要迎接\動訓練科學思維研究的變革,融入大數(shù)據(jù)的變遷,順應時代的變化,明確運動科學訓練研究的對象以及視角,提高運動員比賽能力和運動技巧,從而幫助運動員在比賽中取得良好的成績。
作者簡介:
白曼利(1981.3-),女,民族:漢族,籍貫:陜西咸陽,學歷:研究生,專業(yè):體育教育,研究方向:運動訓練,職稱:副教授。
楊江林(1982.1-),男,民族:漢族,籍貫:云南麗江,學歷:大學本科,專業(yè):體育教育,研究方向:運動訓練,職稱:副教授。
參考文獻:
[關(guān)鍵詞]財政收入;GDP;面板數(shù)據(jù)
中圖分類號:F01 文獻標識碼:A 文章編號:1006-0278(2013)02-024-01
在計量經(jīng)濟學中,我們一般應用的最多的數(shù)據(jù)分析是截面數(shù)據(jù)回歸分析和時間序列分析,但截面數(shù)據(jù)分析和時間序列分析都有著一定的局限性。在實際經(jīng)濟研究當中,截面數(shù)據(jù)回歸分析會遺漏掉數(shù)據(jù)的時間序列特征,例如在分析某年中國各省的GDP增長數(shù)據(jù)時,單純的截面數(shù)據(jù)回歸分析無法找出各省GDP隨時間變化的特征,使得分析結(jié)果沒有深度。而如果只用時間序列分析,則會遺漏掉不同截面間的聯(lián)系與區(qū)別,例如在分析中國單個省市的GDP隨時間增長的數(shù)據(jù)時,無法找出各個省市之間經(jīng)濟增長的聯(lián)系與區(qū)別,因而同樣無法滿足我們的需要。而面板數(shù)據(jù),是一種既包括了時間序列數(shù)據(jù),也包括了相關(guān)截面數(shù)據(jù)的復合數(shù)據(jù),是近年來用得較多的一種數(shù)據(jù)類型。
下面我們將基于2000-2009年中國各省GDP和財政收入的面板數(shù)據(jù)的實例來詳細闡述面板數(shù)據(jù)的分析方法。
一、GDP與財政收入關(guān)系的經(jīng)濟學模型
財政收入是保證國家有效運轉(zhuǎn)的經(jīng)濟基礎(chǔ),在一國經(jīng)濟建設(shè)中發(fā)揮著重要作用。隨著中國經(jīng)濟發(fā)展速度的日益加快,財政收入不斷擴大,而擴大的財政收入又以政府支出來調(diào)節(jié)和推動國民經(jīng)濟發(fā)展。正確認識財政收入與經(jīng)濟增長之間的長期關(guān)系,把握財政收入與經(jīng)濟增長之間的相互影響,發(fā)揮財政收入對經(jīng)濟發(fā)展的調(diào)節(jié)和促進功能,對于完善財稅政策,深化財稅體制改革,實現(xiàn)財政與經(jīng)濟之間的良性互動,具有重要的現(xiàn)實意義。文章就將從中國各省的面板數(shù)據(jù)出發(fā)研究,中國不同地域間財政收入和GDP之間的關(guān)系。
二、實證分析
(一)單位根檢驗
Eviews有兩種單位根檢驗方法,一種在相同根的假設(shè)下的檢驗,包括LLC、Breintung、Hadri。另一種則是在不同根下的假設(shè)前提下,包括IPS,ADF-Fisher和PP-Fisher5。檢驗結(jié)果表明所有檢驗都拒絕原假設(shè),因此序列GDP和CZSR均為一個2階單整序列。
(二)協(xié)整檢驗
如果基于單位根檢驗的結(jié)果發(fā)現(xiàn)變量之間是同階單整的,那么我們可以進行協(xié)整檢驗。協(xié)整檢驗是考察變量間長期均衡關(guān)系的方法。所謂的協(xié)整是指若兩個或多個非平穩(wěn)的變量序列,其某個線性組合后的序列呈平穩(wěn)性。此時我們稱這些變量序列間有協(xié)整關(guān)系存在。
在最終的結(jié)果中,Pedroni方法中除了rho-Statistic、PP-Statistic項目外都拒絕GDP和CZSR不存在協(xié)整關(guān)系的原假設(shè),同樣Kao和Johansen檢驗方法也都拒絕原假設(shè),因此,上述檢驗結(jié)果表明,我國各省2000-20009年的GDP和財政收入面板數(shù)據(jù)間存在著協(xié)整關(guān)系。既然通過了協(xié)整檢驗,說明變量之間存在著長期穩(wěn)定的均衡關(guān)系,其方程回歸殘差是平穩(wěn)的,因此可以在此基礎(chǔ)上直接對進行回歸分析,此時假設(shè)方程的回歸結(jié)果是較精確的。
三、建立模型
混合模型:如果從時間上看,不同個體之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那么就可以直接把面板數(shù)據(jù)混合在一起用普通最小二乘法(OLS)估計參數(shù)。
我們根據(jù)混合模型的回歸結(jié)果,得到財政收入和GDP之間的回歸方程為:
CZSR=227.3123+0.103224*GDP
(26.47637)(0.002839)
R2=0.810995 F=1321.587
顯然從模型的回歸結(jié)構(gòu)來看,R2的值達到了0.81,有了比較好的回歸解釋力,同時,GDP的回歸系數(shù)為0.103224,表明各省的財政收入平均占到了國民收入的10.3%左右。
變系數(shù)模型:顯然,在中國各省之間由于處在不同的地區(qū),因而擁有不同的區(qū)位優(yōu)勢,那么各省的發(fā)展水平顯然就不一樣。正是由于這種不同的地方政策、管理水平、文化差異等會導致經(jīng)濟變量間出現(xiàn)一些關(guān)聯(lián)性的變化,此時在進行模型回歸的時候,我們就有必要考慮變系數(shù)模型。
在回歸結(jié)果中,R2的值達到了0.97,比混合模型擁有更好的回歸解釋力,而在變系數(shù)模型回歸結(jié)果中,GDP的回歸系數(shù)大于0.5的只有、青海、寧夏三個省份,也就是說這三個省份的財政收入占到了GDP的50%以上,他們同處于經(jīng)濟并不是很發(fā)達的西部地區(qū),由此可以看出,處在經(jīng)濟發(fā)達地區(qū)的財政收入占GDP的比重要低,而不發(fā)達地區(qū)則要高。
四、結(jié)論
通過以上的分析檢驗,我們發(fā)現(xiàn)針對于中國財政收入和GDP的面板數(shù)據(jù),我們應建立起變系數(shù)模型,并通過模型分析,我們可以得出這樣的結(jié)論,中國各省間由于存在著地域經(jīng)濟發(fā)展水平不同、管理水平不同以及國家的相關(guān)政策等諸多不同,造成了各省之間在財政收入以及國民收入上面存在著一定的差異。而回歸結(jié)果也告訴我們,我國西部地區(qū)的財政收入占GDP的比例要明顯高于東部地區(qū),地區(qū)發(fā)展落后地區(qū)的財政收入占GDP的比例也要明顯高于東部地區(qū)。因此,這為我們改善我國落后地區(qū)的經(jīng)濟發(fā)展提供了一定的新思路,就是對一地區(qū)的稅收征收可以適當放緩,而將GDP中以前政府占用的部分歸還于民眾和企業(yè),因為,按照發(fā)達地區(qū)的經(jīng)驗表明,財政收入所占比重過高,經(jīng)濟發(fā)展的活力或者就不會很高,對于進一步刺激財政收入的增加也沒有任何幫助。因此,我們應該適度降低財政收入占GDP的比重,從而增加經(jīng)濟活力,使西部地區(qū)以及落后地區(qū)及早的跟上東部發(fā)達地區(qū)的發(fā)展步伐,從而消除我國經(jīng)濟發(fā)展的地域不平衡。
參考文獻:
[1]謝識予,朱洪鑫.高級計量經(jīng)濟學[M].復旦大學出版社,2005.
[2]張曉峒.Eviews使用指南(第二版)[M].南開大學出版社,2004.