五月激情开心网,五月天激情社区,国产a级域名,婷婷激情综合,深爱五月激情网,第四色网址

數(shù)據(jù)分析統(tǒng)計(jì)學(xué)方法優(yōu)選九篇

時(shí)間:2023-07-28 16:42:39

引言:易發(fā)表網(wǎng)憑借豐富的文秘實(shí)踐,為您精心挑選了九篇數(shù)據(jù)分析統(tǒng)計(jì)學(xué)方法范例。如需獲取更多原創(chuàng)內(nèi)容,可隨時(shí)聯(lián)系我們的客服老師。

數(shù)據(jù)分析統(tǒng)計(jì)學(xué)方法

第1篇

關(guān)于醫(yī)學(xué)論文數(shù)據(jù)、資料的統(tǒng)計(jì)分析方法,總結(jié)如下:

1.定量資源

對(duì)于定量資料,應(yīng)根據(jù)所采用的設(shè)計(jì)類(lèi)型、資料所具備的條件和分析目的,選用合適的統(tǒng)計(jì)分析方法,不應(yīng)盲目套用t檢驗(yàn)和單因索方差分析;

2.定性資源

對(duì)于定性資料,應(yīng)根據(jù)所采用的設(shè)計(jì)類(lèi)型、定性變量的性質(zhì)和頻數(shù)所具備的條件以及分析目的,選用合適的統(tǒng)計(jì)分析方法,不應(yīng)盲目套用X-檢驗(yàn);

3.回歸分析

對(duì)于回歸分析,應(yīng)結(jié)合專(zhuān)業(yè)知識(shí)和散布圖,選用合適的回歸類(lèi)型,不應(yīng)盲目套用簡(jiǎn)單直線回歸分析,對(duì)具有重復(fù)實(shí)驗(yàn)數(shù)據(jù)的回歸分析資料,不應(yīng)簡(jiǎn)單化處理;

4. 多因索、多指標(biāo)資料

第2篇

關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);數(shù)據(jù)分析;抽樣理論;理論

重構(gòu)隨著信息科學(xué)技術(shù)的高速度發(fā)展,當(dāng)代獲取和儲(chǔ)存數(shù)據(jù)信息的能力不斷增強(qiáng)而成本不斷下降,這為大數(shù)據(jù)的應(yīng)用提供了必要的技術(shù)環(huán)境和可能.應(yīng)用大數(shù)據(jù)技術(shù)的優(yōu)勢(shì)愈來(lái)愈明顯,它的應(yīng)用能夠幫助人類(lèi)獲取真正有價(jià)值的數(shù)據(jù)信息.近年來(lái),專(zhuān)家學(xué)者有關(guān)大數(shù)據(jù)技術(shù)問(wèn)題進(jìn)行了大量的研究工作[1],很多領(lǐng)域也都受到了大數(shù)據(jù)分析的影響.這個(gè)時(shí)代將大數(shù)據(jù)稱(chēng)為未來(lái)的石油,它必將對(duì)這個(gè)時(shí)代和未來(lái)的社會(huì)經(jīng)濟(jì)以及科學(xué)技術(shù)的發(fā)展產(chǎn)生深遠(yuǎn)的意義和影響.目前對(duì)于大數(shù)據(jù)概念,主要是從數(shù)據(jù)來(lái)源和數(shù)據(jù)的處理工具與處理難度方面考慮,但國(guó)內(nèi)外專(zhuān)家學(xué)者各有各的觀點(diǎn),并沒(méi)有給出一致的精確定義.麥肯錫全球數(shù)據(jù)分析研究所指出大數(shù)據(jù)是數(shù)據(jù)集的大小超越了典型數(shù)據(jù)庫(kù)工具集合、存儲(chǔ)、管理和分析能力的數(shù)據(jù)集,大數(shù)據(jù)被Gartner定義為極端信息管理和處理一個(gè)或多個(gè)維度的傳統(tǒng)信息技術(shù)問(wèn)題[23].目前得到專(zhuān)家們認(rèn)可的一種觀點(diǎn),即:“超大規(guī)模”是GB級(jí)數(shù)據(jù),“海量”是TB級(jí)數(shù)據(jù),而“大數(shù)據(jù)”是PB及其以上級(jí)別數(shù)據(jù)[2].

一些研究學(xué)者把大數(shù)據(jù)特征進(jìn)行概括,稱(chēng)其具有數(shù)據(jù)規(guī)模巨大、類(lèi)型多樣、可利用價(jià)值密度低和處理速度快等特征,同時(shí)特別強(qiáng)調(diào)大數(shù)據(jù)區(qū)別于其他概念的最重要特征是快速動(dòng)態(tài)變化的數(shù)據(jù)和形成流式數(shù)據(jù).大數(shù)據(jù)技術(shù)發(fā)展所面臨的問(wèn)題是數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理和數(shù)據(jù)分析、數(shù)據(jù)顯示和數(shù)據(jù)安全等.大數(shù)據(jù)的數(shù)據(jù)量大、多樣性、復(fù)雜性及實(shí)時(shí)性等特點(diǎn),使得數(shù)據(jù)存儲(chǔ)環(huán)境有了很大變化[45],而大部分傳統(tǒng)的統(tǒng)計(jì)方法只適合分析單個(gè)計(jì)算機(jī)存儲(chǔ)的數(shù)據(jù),這些問(wèn)題無(wú)疑增加了數(shù)據(jù)處理和整合的困難.數(shù)據(jù)分析是大數(shù)據(jù)處理的核心過(guò)程,同時(shí)它也給傳統(tǒng)統(tǒng)計(jì)學(xué)帶來(lái)了巨大的挑戰(zhàn)[6].產(chǎn)生大數(shù)據(jù)的數(shù)據(jù)源通常情況下具有高速度性和實(shí)時(shí)性,所以要求數(shù)據(jù)處理和分析系統(tǒng)也要有快速度和實(shí)時(shí)性特點(diǎn),而傳統(tǒng)統(tǒng)計(jì)分析方法通常不具備快速和實(shí)時(shí)等特點(diǎn).基于大數(shù)據(jù)的特點(diǎn),傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)理論已經(jīng)不能適應(yīng)大數(shù)據(jù)分析與研究的范疇,傳統(tǒng)統(tǒng)計(jì)學(xué)面臨著巨大的機(jī)遇與挑戰(zhàn),然而為了適應(yīng)大數(shù)據(jù)這一新的研究對(duì)象,傳統(tǒng)統(tǒng)計(jì)學(xué)必須進(jìn)行改進(jìn),以繼續(xù)和更好的服務(wù)于人類(lèi).目前國(guó)內(nèi)外將大數(shù)據(jù)和統(tǒng)計(jì)學(xué)相結(jié)合的研究文獻(xiàn)并不多.本文對(duì)大數(shù)據(jù)時(shí)代這一特定環(huán)境背景,統(tǒng)計(jì)學(xué)的抽樣理論和總體理論的存在價(jià)值、統(tǒng)計(jì)方法的重構(gòu)及統(tǒng)計(jì)結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn)的重建等問(wèn)題進(jìn)行分析與研究.

1傳統(tǒng)意義下的統(tǒng)計(jì)學(xué)

廣泛的統(tǒng)計(jì)學(xué)包括三個(gè)類(lèi)型的統(tǒng)計(jì)方法:①處理大量隨機(jī)現(xiàn)象的統(tǒng)計(jì)方法,比如概率論與數(shù)理統(tǒng)計(jì)方法.②處理非隨機(jī)非概率的描述統(tǒng)計(jì)方法,如指數(shù)編制、社會(huì)調(diào)查等方法.③處理和特定學(xué)科相關(guān)聯(lián)的特殊方法,如經(jīng)濟(jì)統(tǒng)計(jì)方法、環(huán)境科學(xué)統(tǒng)計(jì)方法等[7].受收集、處理數(shù)據(jù)的工具和能力的限制,人們幾乎不可能收集到全部的數(shù)據(jù)信息,因此傳統(tǒng)的統(tǒng)計(jì)學(xué)理論和方法基本上都是在樣本上進(jìn)行的.或者即使能夠得到所有數(shù)據(jù),但從實(shí)際角度出發(fā),因所需成本過(guò)大,也會(huì)放棄搜集全部數(shù)據(jù).然而,選擇最佳的抽樣方法和統(tǒng)計(jì)分析方法,也只能最大程度還原總體一個(gè)特定方面或某些方面的特征.事實(shí)上我們所察覺(jué)到的數(shù)據(jù)特征也只是總體大量特征中的一小部分,更多的其他特征尚待發(fā)掘.總之,傳統(tǒng)統(tǒng)計(jì)學(xué)是建立在抽樣理論基礎(chǔ)上,以點(diǎn)帶面的統(tǒng)計(jì)分析方法,強(qiáng)調(diào)因果關(guān)系的統(tǒng)計(jì)分析結(jié)果,推斷所測(cè)對(duì)象的總體本質(zhì)的一門(mén)科學(xué),是通過(guò)搜集、整理和分析研究數(shù)據(jù)從而探索數(shù)據(jù)內(nèi)部存在規(guī)律的一門(mén)科學(xué).

2統(tǒng)計(jì)學(xué)是大數(shù)據(jù)分析的核心

數(shù)的產(chǎn)生基于三個(gè)要素,分別是數(shù)、量和計(jì)量單位.在用數(shù)來(lái)表示事物的特征并采用了科學(xué)的計(jì)量單位后,就產(chǎn)生了真正意義上的數(shù)據(jù),即有根據(jù)的數(shù).科學(xué)數(shù)據(jù)是基于科學(xué)設(shè)計(jì),通過(guò)使用觀察和測(cè)量獲得的數(shù)據(jù),認(rèn)知自然現(xiàn)象和社會(huì)現(xiàn)象的變化規(guī)律,或者用來(lái)檢驗(yàn)已經(jīng)存在的理論假設(shè),由此得到了具有實(shí)際意義和理論意義的數(shù)據(jù).從數(shù)據(jù)中獲得科學(xué)數(shù)據(jù)的理論,即統(tǒng)計(jì)學(xué)理論.科學(xué)數(shù)據(jù)是通過(guò)統(tǒng)計(jì)學(xué)理論獲得的,而統(tǒng)計(jì)學(xué)理論是為獲得科學(xué)數(shù)據(jù)而產(chǎn)生的一門(mén)科學(xué).若說(shuō)數(shù)據(jù)是傳達(dá)事物特征的精確語(yǔ)言,進(jìn)行科學(xué)研究的必備條件,認(rèn)知世界的重要工具,那么大數(shù)據(jù)分析就是讓數(shù)據(jù)最大限度地發(fā)揮功能,充分表達(dá)并有效滿(mǎn)足不同需求的基本要求.基于統(tǒng)計(jì)學(xué)的發(fā)展史及在數(shù)據(jù)分析中的作用,完成將數(shù)據(jù)轉(zhuǎn)化為知識(shí)、挖掘數(shù)據(jù)內(nèi)在規(guī)律、通過(guò)數(shù)據(jù)發(fā)現(xiàn)并解決實(shí)際問(wèn)題、預(yù)測(cè)可能發(fā)生的結(jié)果等是研究大數(shù)據(jù)的任務(wù),而這必然離不開(kāi)統(tǒng)計(jì)學(xué).以大數(shù)據(jù)為研究對(duì)象,通過(guò)數(shù)據(jù)挖掘、提取、分析等手段探索現(xiàn)象內(nèi)在本質(zhì)的數(shù)據(jù)科學(xué)必須在繼承或改進(jìn)統(tǒng)計(jì)學(xué)理論的基礎(chǔ)上產(chǎn)生.

統(tǒng)計(jì)數(shù)據(jù)的發(fā)展變化經(jīng)歷了一系列過(guò)程,從只能收集到少量的數(shù)據(jù)到盡量多地收集數(shù)據(jù),到科學(xué)利用樣本數(shù)據(jù),再到綜合利用各類(lèi)數(shù)據(jù),以至于發(fā)展到今天的選擇使用大數(shù)據(jù)的過(guò)程.而統(tǒng)計(jì)分析為了適應(yīng)數(shù)據(jù)可觀察集的不斷增大,也經(jīng)歷了相應(yīng)的各個(gè)不同階段,產(chǎn)生了統(tǒng)計(jì)分組法、大量觀察法、歸納推斷法、綜合指標(biāo)法、模型方程法和數(shù)據(jù)挖掘法等分析方法,并且借助計(jì)算機(jī)以及其他軟件的程度也越來(lái)越深.300多年來(lái),隨著數(shù)據(jù)量以指數(shù)速度的不斷增長(zhǎng),統(tǒng)計(jì)學(xué)圍繞如何搜集、整理和分析數(shù)據(jù)而展開(kāi),合理構(gòu)建了應(yīng)用方法體系,幫助各個(gè)學(xué)科解決了許多復(fù)雜問(wèn)題.現(xiàn)在進(jìn)入了大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)學(xué)依舊是數(shù)據(jù)分析的靈魂,大數(shù)據(jù)分析是數(shù)據(jù)科學(xué)賦予統(tǒng)計(jì)學(xué)的新任務(wù).對(duì)于統(tǒng)計(jì)學(xué)而言,來(lái)自新時(shí)代的數(shù)據(jù)科學(xué)挑戰(zhàn)有可能促使新思想、新方法和新技術(shù)產(chǎn)生,這一挑戰(zhàn)也意味著對(duì)于統(tǒng)計(jì)學(xué)理論將面臨巨大的機(jī)遇.

3統(tǒng)計(jì)學(xué)在大數(shù)據(jù)時(shí)代下必須改革

傳統(tǒng)統(tǒng)計(jì)學(xué)是通過(guò)對(duì)總體進(jìn)行抽樣來(lái)搜索數(shù)據(jù),對(duì)樣本數(shù)據(jù)進(jìn)行整理、分析、描述等,從而推斷所測(cè)對(duì)象的總體本質(zhì),甚至預(yù)測(cè)總體未來(lái)的一門(mén)綜合性學(xué)科.從研究對(duì)象到統(tǒng)計(jì)結(jié)果的評(píng)判標(biāo)準(zhǔn)都是離不開(kāi)樣本的抽取,完全不能適應(yīng)大數(shù)據(jù)的4V特點(diǎn),所以統(tǒng)計(jì)學(xué)為適應(yīng)大數(shù)據(jù)技術(shù)的發(fā)展,必須進(jìn)行改革.從學(xué)科發(fā)展角度出發(fā),大數(shù)據(jù)對(duì)海量數(shù)據(jù)進(jìn)行存儲(chǔ)、整合、處理和分析,可以看成是一種新的數(shù)據(jù)分析方法.數(shù)據(jù)關(guān)系的內(nèi)在本質(zhì)決定了大數(shù)據(jù)和統(tǒng)計(jì)學(xué)之間必然存在聯(lián)系,大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的發(fā)展提出了挑戰(zhàn),體現(xiàn)在大樣本標(biāo)準(zhǔn)的調(diào)整、樣本選取標(biāo)準(zhǔn)和形式的重新確定、統(tǒng)計(jì)軟件有待升級(jí)和開(kāi)發(fā)及實(shí)質(zhì)性統(tǒng)計(jì)方法的大數(shù)據(jù)化.但是也提供了一個(gè)機(jī)遇,體現(xiàn)在統(tǒng)計(jì)質(zhì)量的提高、統(tǒng)計(jì)成本的下降、統(tǒng)計(jì)學(xué)作用領(lǐng)域的擴(kuò)大、統(tǒng)計(jì)學(xué)科體系的延伸以及統(tǒng)計(jì)學(xué)家地位的提升[7].

3.1大數(shù)據(jù)時(shí)代抽樣和總體理論存在價(jià)值

傳統(tǒng)統(tǒng)計(jì)學(xué)中的樣本數(shù)據(jù)來(lái)自總體,而總體是客觀存在的全體,可以通過(guò)觀測(cè)到的或經(jīng)過(guò)抽樣而得到的數(shù)據(jù)來(lái)認(rèn)知總體.但是在大數(shù)據(jù)時(shí)代,不再是隨機(jī)樣本,而是全部的數(shù)據(jù),還需要假定一個(gè)看不見(jiàn)摸不著的總體嗎?如果將大數(shù)據(jù)看成一個(gè)高維度的大樣本集合,針對(duì)樣本大的問(wèn)題,按照傳統(tǒng)統(tǒng)計(jì)學(xué)的方法,可以采用抽樣的方法來(lái)減少樣本容量,并且可以達(dá)到需要的精度;對(duì)于維度高的問(wèn)題,可以采取對(duì)變量進(jìn)行選擇、降維、壓縮、分解等方法來(lái)降低數(shù)據(jù)的復(fù)雜程度.但實(shí)際上很難做得到,大數(shù)據(jù)涵蓋多學(xué)科領(lǐng)域、多源、混合的數(shù)據(jù),各學(xué)科之間的數(shù)據(jù)融合,學(xué)科邊界模糊,各范疇的數(shù)據(jù)集互相重疊,合成一體,而且大數(shù)據(jù)涉及到各種數(shù)據(jù)類(lèi)型.因此想要通過(guò)抽樣而使數(shù)據(jù)量達(dá)到傳統(tǒng)統(tǒng)計(jì)學(xué)的統(tǒng)計(jì)分析能力范圍是一件相當(dāng)困難或是一件不可能的事.大量的結(jié)構(gòu)數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)交織在一起,系統(tǒng)首先要認(rèn)清哪個(gè)是有價(jià)值的信息,哪個(gè)是噪聲,以及哪些不同類(lèi)型的數(shù)據(jù)信息來(lái)自于同一個(gè)地址的數(shù)據(jù)源,等等,傳統(tǒng)的統(tǒng)計(jì)學(xué)是無(wú)法做到的.在大數(shù)據(jù)時(shí)代下,是否需要打破傳統(tǒng)意義的抽樣理論、總體及樣本等概念和關(guān)系,是假設(shè)“樣本=總體”,還是“樣本趨近于總體”,還是不再使用總體和樣本這兩個(gè)概念,而重新定義一個(gè)更合適的概念,等等.人們?cè)撛鯓印鞍才拧背闃印⒖傮w及樣本等理論,或人們?cè)撛鯓有拚闃印⒖傮w、樣本的“公理化”定義,這個(gè)問(wèn)題是大數(shù)據(jù)時(shí)代下,傳統(tǒng)統(tǒng)計(jì)學(xué)面臨改進(jìn)的首要問(wèn)題.

3.2統(tǒng)計(jì)方法在大數(shù)據(jù)時(shí)代下的重構(gòu)問(wèn)題

在大數(shù)據(jù)時(shí)代下,傳統(tǒng)的高維度表達(dá)、結(jié)構(gòu)描述和群體行為分析方法已經(jīng)不能精確表達(dá)大數(shù)據(jù)在異構(gòu)性、交互性、時(shí)效性、突發(fā)性等方面的特點(diǎn),傳統(tǒng)的“假設(shè)-模型-檢驗(yàn)”的統(tǒng)計(jì)方法受到了質(zhì)疑,而且從“數(shù)據(jù)”到“數(shù)據(jù)”的統(tǒng)計(jì)模式還沒(méi)有真正建立,急切需要一個(gè)新的理論體系來(lái)指引,從而建立新的分析模型.去除數(shù)據(jù)噪聲、篩選有價(jià)值的數(shù)據(jù)、整合不同類(lèi)型的數(shù)據(jù)、快速對(duì)數(shù)據(jù)做出分析并得出分析結(jié)果等一系列問(wèn)題都有待于研究.大數(shù)據(jù)分析涉及到三個(gè)維度,即時(shí)間維度、空間維度和數(shù)據(jù)本身的維度,怎樣才能全面、深入地分析大數(shù)據(jù)的復(fù)雜性與特性,掌握大數(shù)據(jù)的不確定性,構(gòu)建高效的大數(shù)據(jù)計(jì)算模型,變成了大數(shù)據(jù)分析的突破口.科學(xué)數(shù)據(jù)的演變是一個(gè)從簡(jiǎn)單到復(fù)雜的各種形式不斷豐富、相互包容的過(guò)程,是一個(gè)循序漸進(jìn)的過(guò)程,而不是簡(jiǎn)單的由一種形式取代另一種形式.研究科學(xué)數(shù)據(jù)的統(tǒng)計(jì)學(xué)理論也是一樣,也是由簡(jiǎn)單到復(fù)雜的各種形式相互包容、不斷豐富的發(fā)展過(guò)程,而絕不是完全否定一種理論、由另一種理論形式所代替.大數(shù)據(jù)時(shí)代的到來(lái)統(tǒng)計(jì)學(xué)理論必須要進(jìn)行不斷的完善和發(fā)展,以適應(yīng)呈指數(shù)增長(zhǎng)的數(shù)據(jù)量的大數(shù)據(jù)分析的需要.

3.3如何構(gòu)建大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn)框架

大數(shù)據(jù)時(shí)代下,統(tǒng)計(jì)分析評(píng)價(jià)的標(biāo)準(zhǔn)又該如何變化?傳統(tǒng)統(tǒng)計(jì)分析的評(píng)價(jià)標(biāo)準(zhǔn)有兩個(gè)方面,一是可靠性評(píng)價(jià),二是有效性評(píng)價(jià),然而這兩種評(píng)價(jià)標(biāo)準(zhǔn)都因抽樣而生.可靠性評(píng)價(jià)是指用樣本去推斷總體有多大的把握程度,一般用概率來(lái)衡量.可靠性評(píng)價(jià)有時(shí)表現(xiàn)為置信水平,有時(shí)表現(xiàn)為顯著性水平[8].怎么確定顯著性水平一直是個(gè)存在爭(zhēng)議的問(wèn)題,特別是在模型擬合度評(píng)價(jià)和假設(shè)檢驗(yàn)中,因?yàn)楦髯詤⒄盏姆植碱?lèi)型不一樣,其統(tǒng)計(jì)量就不一樣,顯著性評(píng)價(jià)的臨界值也就不一樣,可是臨界值又與顯著性水平的高低直接相關(guān).而大數(shù)據(jù)在一定程度上是全體數(shù)據(jù),因此不存在以樣本推斷總體的問(wèn)題,那么在這種情況下,置信水平、可靠性問(wèn)題怎么確定?依據(jù)是什么?有效性評(píng)價(jià)指的是真實(shí)性,即為誤差的大小,它與準(zhǔn)確性、精確性有關(guān).通常準(zhǔn)確性是指觀察值與真實(shí)值的吻合程度,一般是無(wú)法衡量的,而精確性用抽樣分布的標(biāo)準(zhǔn)差來(lái)衡量.顯然,精確性是針對(duì)樣本數(shù)據(jù)而言的,也就是說(shuō)樣本數(shù)據(jù)有精確性問(wèn)題,同時(shí)也有準(zhǔn)確性問(wèn)題.抽樣誤差和非抽樣誤差都可能存在于樣本數(shù)據(jù)中,抽樣誤差可以計(jì)算和控制,但是非抽樣誤差只能通過(guò)各種方式加以識(shí)別或判斷[910].大多數(shù)情況下,對(duì)于樣本量不是太大的樣本,非抽樣誤差可以得到較好的防范,然而對(duì)于大數(shù)據(jù)的全體數(shù)據(jù)而言,沒(méi)有抽樣誤差問(wèn)題,只有非抽樣誤差問(wèn)題,也就是說(shuō)大數(shù)據(jù)的真實(shí)性只表現(xiàn)為準(zhǔn)確性.但是由于大數(shù)據(jù)特有的種種特性,使得大數(shù)據(jù)的非抽樣誤差很難進(jìn)行防范、控制,也很難對(duì)其進(jìn)行準(zhǔn)確性評(píng)價(jià).總之,對(duì)于大數(shù)據(jù)分析來(lái)說(shuō),有些統(tǒng)計(jì)分析理論是否還有意義,確切說(shuō)有哪些統(tǒng)計(jì)學(xué)中的理論可以適用于大數(shù)據(jù)分析,而哪些統(tǒng)計(jì)學(xué)中的理論需要改進(jìn),哪些統(tǒng)計(jì)學(xué)中的理論已不再適用于大數(shù)據(jù)統(tǒng)計(jì)研究,等等,都有待于研究.所以大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)學(xué)必是在繼承中求改進(jìn),改進(jìn)中求發(fā)展,重構(gòu)適應(yīng)大數(shù)據(jù)時(shí)代的新統(tǒng)計(jì)學(xué)理論.

4結(jié)論

來(lái)自于社會(huì)各種數(shù)據(jù)源的數(shù)據(jù)量呈指數(shù)增長(zhǎng),大數(shù)據(jù)對(duì)社會(huì)發(fā)展的推動(dòng)力呈指數(shù)效應(yīng),大數(shù)據(jù)已是生命活動(dòng)的主要承載者.一個(gè)新事物的出現(xiàn),必然導(dǎo)致傳統(tǒng)觀念和傳統(tǒng)技術(shù)的變革.對(duì)傳統(tǒng)統(tǒng)計(jì)學(xué)來(lái)說(shuō),大數(shù)據(jù)時(shí)代的到來(lái)無(wú)疑是一個(gè)挑戰(zhàn),雖然傳統(tǒng)統(tǒng)計(jì)學(xué)必須做出改變,但是占據(jù)主導(dǎo)地位的依然會(huì)是統(tǒng)計(jì)學(xué),它會(huì)引領(lǐng)人類(lèi)合理分析利用大數(shù)據(jù)資源.大數(shù)據(jù)給統(tǒng)計(jì)學(xué)帶來(lái)了機(jī)遇和挑戰(zhàn),統(tǒng)計(jì)學(xué)家們應(yīng)該積極學(xué)習(xí)新事物,適應(yīng)新環(huán)境,努力為大數(shù)據(jù)時(shí)代創(chuàng)造出新的統(tǒng)計(jì)方法,擴(kuò)大統(tǒng)計(jì)學(xué)的應(yīng)用范圍.

參考文獻(xiàn):

[1]陳冬玲,曾文.頻繁模式挖掘中基于CFP的應(yīng)用模型[J]沈陽(yáng)大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,27(4):296300.

[3]卞友江.“大數(shù)據(jù)”概念考辨[J].新聞研究導(dǎo)刊,2013,35(5):2528.

[5]靳小龍,王元卓,程學(xué)旗.大數(shù)據(jù)的研究體系與現(xiàn)狀[J].信息通信技術(shù),2013(6):3543.

[6]覃雄派,王會(huì)舉,杜小勇,等.大數(shù)據(jù)分析:Rdbms與Mapreduce的競(jìng)爭(zhēng)與共生[J].軟件學(xué)報(bào),2012,23(1):32-45.

[7]游士兵,張佩,姚雪梅.大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)和機(jī)遇[J].珞珈管理評(píng)論,2013(2):165171.

[8]李金昌.大數(shù)據(jù)與統(tǒng)計(jì)新思維[J].統(tǒng)計(jì)研究,2014,31(1):1017.

第3篇

關(guān)鍵詞:統(tǒng)計(jì)學(xué);教育改革;大數(shù)據(jù)

一、引言

最早提出大數(shù)據(jù)時(shí)代到來(lái)的機(jī)構(gòu)是全球知名的麥肯錫咨詢(xún)公司,該公司在一份研究報(bào)告中指出:“數(shù)據(jù)已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素,人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)”。

大數(shù)據(jù)是隨著互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用帶來(lái)的數(shù)據(jù)量和數(shù)據(jù)類(lèi)型激增而衍生出來(lái)的一種現(xiàn)象,但大數(shù)據(jù)一詞不僅指規(guī)模大、種類(lèi)多的數(shù)據(jù)集,還包括對(duì)這種數(shù)據(jù)集進(jìn)行采集、處理與分析以提取有價(jià)值信息和直接創(chuàng)造價(jià)值的技術(shù)構(gòu)架和技術(shù)過(guò)程。大數(shù)據(jù)的第一個(gè)特征是數(shù)據(jù)量巨大。截止到2012年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級(jí)別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級(jí)別。第二個(gè)特征是數(shù)據(jù)類(lèi)型繁多、異構(gòu)性突出,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等等。第三個(gè)特征是數(shù)據(jù)價(jià)值密度較低,數(shù)據(jù)中存在大量重復(fù)性和無(wú)價(jià)值性信息或噪聲。如何通過(guò)強(qiáng)大的計(jì)算技術(shù)和統(tǒng)計(jì)分析等方法迅速完成數(shù)據(jù)的價(jià)值提純,是大數(shù)據(jù)時(shí)代亟待解決的難題。第四個(gè)特征是處理速度快、時(shí)效性要求高。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。

目前,不同的學(xué)科領(lǐng)域?qū)Υ髷?shù)據(jù)概念有著不盡相同的解釋?zhuān)鞣N解釋中大致可以從兩個(gè)方面去理解。首先,大數(shù)據(jù)概念體現(xiàn)在數(shù)據(jù)量的巨大、種類(lèi)的眾多及產(chǎn)生速度的飛快,同時(shí)產(chǎn)生的數(shù)據(jù)集極有可能包含著各種半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);其次,大數(shù)據(jù)概念還體現(xiàn)在對(duì)數(shù)據(jù)進(jìn)行處理的手段和流程方面,由于數(shù)據(jù)量的龐大和類(lèi)型復(fù)雜,利用常規(guī)的統(tǒng)計(jì)軟件已經(jīng)無(wú)法對(duì)當(dāng)今的數(shù)據(jù)進(jìn)行及時(shí)有效的存儲(chǔ)、分析及處理。因此,所謂的大數(shù)據(jù)并不是單純指數(shù)據(jù)流量的巨大,還指其結(jié)構(gòu)的復(fù)雜和種類(lèi)的多樣,在數(shù)據(jù)處理和分析上需要采用高端計(jì)算平臺(tái)或高級(jí)統(tǒng)計(jì)軟件,以及海量數(shù)據(jù)中存在著可挖掘的潛在的大量?jī)r(jià)值信息與知識(shí)。

近年來(lái),隨著高速計(jì)算機(jī)的應(yīng)用、信息技術(shù)的快速發(fā)展,特別是云計(jì)算技術(shù)的發(fā)展,使大數(shù)據(jù)的存儲(chǔ)和分析技術(shù)得到迅速發(fā)展,目前的核心技術(shù)有MapReduce、GFS、BigTable、Hadoop,以及數(shù)據(jù)可視化等。在數(shù)據(jù)搜集上,可方便地通過(guò)在線互聯(lián)網(wǎng)數(shù)據(jù)庫(kù)獲取二手?jǐn)?shù)據(jù)或一手實(shí)時(shí)數(shù)據(jù)。在數(shù)據(jù)分析上,傳統(tǒng)統(tǒng)計(jì)學(xué)方法采取的是基于統(tǒng)計(jì)模型的樣本數(shù)據(jù)分析,而大數(shù)據(jù)分析技術(shù)則是通過(guò)高端計(jì)算平臺(tái),對(duì)大數(shù)據(jù)中的信息進(jìn)行挖掘。

統(tǒng)計(jì)學(xué)作為對(duì)數(shù)據(jù)進(jìn)行處理和分析的科學(xué),必然受到大數(shù)據(jù)的影響。在大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)學(xué)教育必須與時(shí)俱進(jìn),跟上時(shí)展步伐。近年來(lái),有不少文獻(xiàn)討論了大數(shù)據(jù)環(huán)境下我國(guó)統(tǒng)計(jì)學(xué)教育的改革問(wèn)題(例如[1]-[5]),本文在分析大數(shù)據(jù)時(shí)代特征的前提下,進(jìn)一步討論我國(guó)統(tǒng)計(jì)學(xué)教育的現(xiàn)狀與挑戰(zhàn)、統(tǒng)計(jì)學(xué)教育改革的內(nèi)容、方法、借鑒和適應(yīng)時(shí)代要求的變革問(wèn)題。

二、統(tǒng)計(jì)學(xué)教育的現(xiàn)狀與挑戰(zhàn)

2013年,教育部對(duì)我國(guó)統(tǒng)計(jì)學(xué)專(zhuān)業(yè)設(shè)置進(jìn)行一次新的調(diào)整,將原來(lái)的既可授予理學(xué)學(xué)位,也可授予經(jīng)濟(jì)學(xué)學(xué)位的統(tǒng)計(jì)學(xué)專(zhuān)業(yè)劃分為統(tǒng)計(jì)學(xué)、應(yīng)用統(tǒng)計(jì)學(xué)和經(jīng)濟(jì)統(tǒng)計(jì)學(xué)三個(gè)本科專(zhuān)業(yè)[6]。根據(jù)教育部高等學(xué)校統(tǒng)計(jì)類(lèi)專(zhuān)業(yè)教學(xué)指導(dǎo)委員會(huì)2013年11月公布的數(shù)據(jù),當(dāng)時(shí)全國(guó)有194所高校開(kāi)設(shè)了統(tǒng)計(jì)學(xué)專(zhuān)業(yè),156所高校開(kāi)設(shè)了應(yīng)用統(tǒng)計(jì)學(xué)專(zhuān)業(yè),164所高校開(kāi)設(shè)了經(jīng)濟(jì)統(tǒng)計(jì)學(xué)專(zhuān)業(yè)[6]。目前,全國(guó)開(kāi)設(shè)這三個(gè)統(tǒng)計(jì)學(xué)專(zhuān)業(yè)的高校個(gè)數(shù)和在校學(xué)生人數(shù)與2013年相比都有不少的增加。

面對(duì)大數(shù)據(jù)時(shí)代,我們目前的統(tǒng)計(jì)學(xué)教育無(wú)論在培養(yǎng)目標(biāo)和教學(xué)內(nèi)容上,還是在教育方式和人才培養(yǎng)模式上,都存在著亟待解決的挑戰(zhàn)性問(wèn)題。例如,在專(zhuān)業(yè)培養(yǎng)目標(biāo)和人才培養(yǎng)過(guò)程中,我們比較重視課程層面上的評(píng)價(jià),比較輕視專(zhuān)業(yè)層面上的整體評(píng)價(jià),缺乏對(duì)學(xué)生綜合能力的反饋機(jī)制。

關(guān)于教學(xué)內(nèi)容,目前三個(gè)統(tǒng)計(jì)學(xué)專(zhuān)業(yè)在統(tǒng)計(jì)理論和應(yīng)用統(tǒng)計(jì)兩個(gè)方面有不同的側(cè)重。統(tǒng)計(jì)理論主要包括:抽樣理論、實(shí)驗(yàn)設(shè)計(jì)、估汁理論、假設(shè)險(xiǎn)驗(yàn)、決策理論、貝葉斯統(tǒng)計(jì)、半?yún)?shù)和非參數(shù)統(tǒng)計(jì)、序貫分析、多元統(tǒng)計(jì)分析、時(shí)間序列分析、小樣本理論和大樣本理論等。在數(shù)據(jù)分析中,現(xiàn)今的統(tǒng)計(jì)方法基本以結(jié)構(gòu)化數(shù)據(jù)為主要處理對(duì)象,而對(duì)非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的分析和工具涉及較少。因此,現(xiàn)今統(tǒng)計(jì)學(xué)課程及內(nèi)容已不能滿(mǎn)足從事非結(jié)構(gòu)型和半結(jié)構(gòu)型的大數(shù)據(jù)研究和商業(yè)應(yīng)用對(duì)人才培養(yǎng)的需要,必須進(jìn)行必要的改革。

對(duì)于教育方式,鑒于大數(shù)據(jù)時(shí)代要求,統(tǒng)計(jì)分析人員需要具備較高的數(shù)學(xué)和現(xiàn)代統(tǒng)計(jì)學(xué)基礎(chǔ),具有較高的軟件操作能力,掌握一定的大數(shù)據(jù)收集、整理、分析、處理和挖掘數(shù)據(jù)的技能。日本學(xué)者城田真琴認(rèn)為:“數(shù)據(jù)科學(xué)家要有計(jì)算機(jī)科學(xué)專(zhuān)業(yè)背景,數(shù)學(xué)、統(tǒng)計(jì)方面的素養(yǎng)和使用數(shù)據(jù)挖掘軟件的技能,善于利用數(shù)據(jù)可視化的手法展現(xiàn)晦澀難懂的信息,而且具備相應(yīng)的專(zhuān)業(yè)知識(shí)、眼界和視野,具有適應(yīng)社會(huì)發(fā)展和創(chuàng)造價(jià)值的能力”。現(xiàn)今的統(tǒng)計(jì)學(xué)教育方式還不能很好適應(yīng)大數(shù)據(jù)時(shí)代數(shù)據(jù)科學(xué)人才培養(yǎng)需要,必須進(jìn)行必要及時(shí)的調(diào)整和變革。

對(duì)人才培養(yǎng)模式,大數(shù)據(jù)時(shí)代不僅要求培養(yǎng)具有數(shù)據(jù)處理和分析所需的基本素質(zhì)與技能,更重視培養(yǎng)從海量數(shù)據(jù)中發(fā)現(xiàn)和挖掘價(jià)值信息、把握市場(chǎng)機(jī)遇、創(chuàng)造利潤(rùn)的潛在能力。面對(duì)大數(shù)據(jù)時(shí)代的諸多挑戰(zhàn),現(xiàn)代統(tǒng)計(jì)技術(shù)、數(shù)據(jù)挖掘方法、計(jì)算機(jī)信息技術(shù)、軟件工具和理念的日新月異,培養(yǎng)統(tǒng)計(jì)人才的教育模式也需要相應(yīng)變化,統(tǒng)計(jì)學(xué)教育只有與時(shí)俱進(jìn),主動(dòng)做出全面的調(diào)整和變革才能適應(yīng)新時(shí)代知識(shí)進(jìn)步和激烈人才市場(chǎng)競(jìng)爭(zhēng)的需要,積極迎接大數(shù)據(jù)時(shí)代的挑戰(zhàn)。

大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)學(xué)教師有更高的要求,統(tǒng)計(jì)學(xué)教師需要與時(shí)俱進(jìn),跟上時(shí)代步伐。隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等信息技術(shù)的發(fā)展,對(duì)數(shù)據(jù)的分析和處理的技術(shù)也隨之要求更高,統(tǒng)計(jì)學(xué)教師固有的知識(shí)體系已不能滿(mǎn)足培養(yǎng)現(xiàn)代統(tǒng)計(jì)人才的需要,必須進(jìn)一步深化和更新原有的統(tǒng)計(jì)學(xué)理論知識(shí),而且還需要學(xué)習(xí)掌握計(jì)算機(jī)技術(shù)、互聯(lián)網(wǎng)、數(shù)據(jù)庫(kù)和信息科學(xué)等有關(guān)知識(shí)和技術(shù),同時(shí)還要熟悉處理非結(jié)構(gòu)型和半結(jié)構(gòu)型數(shù)據(jù)的知識(shí)和技能,以適應(yīng)現(xiàn)代統(tǒng)計(jì)學(xué)教育對(duì)教師的知識(shí)結(jié)構(gòu)和基本素質(zhì)的要求。

大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)專(zhuān)業(yè)的學(xué)生也提出了更高的要求,他們不僅需要掌握現(xiàn)代統(tǒng)計(jì)理論、統(tǒng)計(jì)方法和專(zhuān)業(yè)統(tǒng)計(jì)軟件,還要學(xué)會(huì)如何分析、處理來(lái)自互聯(lián)網(wǎng)或各種實(shí)際問(wèn)題中的海量數(shù)據(jù),如何利用統(tǒng)計(jì)軟件和互聯(lián)網(wǎng)技術(shù)進(jìn)行數(shù)據(jù)操作,如何借助軟件技術(shù)和統(tǒng)計(jì)準(zhǔn)則判斷數(shù)據(jù)質(zhì)量,如何進(jìn)行模型選擇和評(píng)價(jià)模型方法的有效性,如何準(zhǔn)確清晰地呈現(xiàn)統(tǒng)計(jì)分析結(jié)果和結(jié)論,等等。

2014年11月,美國(guó)統(tǒng)計(jì)學(xué)會(huì)了統(tǒng)計(jì)學(xué)本科專(zhuān)業(yè)指導(dǎo)性教學(xué)綱要 [7],該教學(xué)綱要對(duì)統(tǒng)計(jì)學(xué)專(zhuān)業(yè)提出四個(gè)方面的要求:(1)具有扎實(shí)的數(shù)學(xué)和統(tǒng)計(jì)學(xué)基礎(chǔ)、強(qiáng)大的統(tǒng)計(jì)計(jì)算和編程能力,熟練使用統(tǒng)計(jì)軟件和數(shù)據(jù)庫(kù);(2)分析來(lái)自現(xiàn)實(shí)問(wèn)題的真實(shí)數(shù)據(jù),真實(shí)數(shù)據(jù)是統(tǒng)計(jì)專(zhuān)業(yè)教育的重要組成部分;(3)掌握多樣化的統(tǒng)計(jì)模型方法;(4)具有通過(guò)語(yǔ)言、圖表和動(dòng)畫(huà)等方式解釋數(shù)據(jù)分析結(jié)果的能力。美國(guó)是統(tǒng)計(jì)學(xué)教育和人才培養(yǎng)最先進(jìn)的國(guó)家之一,該指導(dǎo)性教學(xué)綱要代表著美國(guó)統(tǒng)計(jì)學(xué)專(zhuān)業(yè)培養(yǎng)人才的基本要求和發(fā)展方向,對(duì)我國(guó)統(tǒng)計(jì)教育的改革具有重要的參考價(jià)值。以該指導(dǎo)性教學(xué)綱要為參考依據(jù),對(duì)照我國(guó)目前的統(tǒng)計(jì)學(xué)本科專(zhuān)業(yè)教育,無(wú)論是在培養(yǎng)目標(biāo)和課程設(shè)置方面,還是在教學(xué)內(nèi)容和教學(xué)方法方面,都存在著亟待解決的挑戰(zhàn)性問(wèn)題。

三、統(tǒng)計(jì)學(xué)教育的改革

大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)學(xué)教育不僅是各種統(tǒng)計(jì)方法、數(shù)據(jù)挖掘方法和信息技術(shù)手段的延續(xù)或發(fā)展,更主要的是這些方法的集成應(yīng)用和在實(shí)際數(shù)據(jù)分析中的真實(shí)體驗(yàn)。過(guò)去,企業(yè)數(shù)據(jù)庫(kù)價(jià)格昂貴,在統(tǒng)計(jì)學(xué)教育的教學(xué)案例或?qū)嶒?yàn)課教學(xué)中,很少采用真實(shí)和海量的數(shù)據(jù)庫(kù)資源,基本都是采用過(guò)時(shí)或虛擬的數(shù)據(jù)。今天,像百度大數(shù)據(jù)引擎這樣的數(shù)據(jù)庫(kù)的逐步對(duì)外開(kāi)放,將有助于開(kāi)展“線上大數(shù)據(jù)統(tǒng)計(jì)實(shí)驗(yàn)”教學(xué)。為了適應(yīng)大數(shù)據(jù)時(shí)代要求,有必要利用網(wǎng)絡(luò)資源以及各種數(shù)據(jù)處理軟件,搭建線上大數(shù)據(jù)分析實(shí)驗(yàn)教學(xué)平臺(tái),全面開(kāi)展大數(shù)據(jù)統(tǒng)計(jì)實(shí)驗(yàn)教學(xué)的改革。實(shí)際上,借助大數(shù)據(jù)分析平臺(tái),本科階段的統(tǒng)計(jì)學(xué)教育就可以融人聯(lián)機(jī)分析和數(shù)據(jù)的可視化教學(xué)。其次,要時(shí)刻關(guān)注大數(shù)據(jù)分析理論的進(jìn)展,及時(shí)將新理論新方法融入課堂教學(xué)內(nèi)容。

需要指出的是,在大數(shù)據(jù)時(shí)代,經(jīng)典統(tǒng)計(jì)理論和方法并沒(méi)有過(guò)時(shí),但需要進(jìn)行改進(jìn)和進(jìn)一步發(fā)展。這是因?yàn)椋W(wǎng)上采集的巨型數(shù)據(jù)集往往存在大量的重復(fù)性和無(wú)價(jià)值數(shù)據(jù)信息,使得大數(shù)據(jù)價(jià)值密度降低。在對(duì)這些數(shù)據(jù)進(jìn)行分析處理之前往往需要通過(guò)去噪、分層、截?cái)唷⒕垲?lèi)等方法的預(yù)處理,將其變成便于進(jìn)行分析處理的小數(shù)據(jù),繼而借助于經(jīng)典統(tǒng)計(jì)方法進(jìn)行分析和處理。因而在大數(shù)據(jù)時(shí)代仍然需要采用傳統(tǒng)統(tǒng)計(jì)學(xué)的小樣本理論和方法。所以,即便是在大數(shù)據(jù)時(shí)代,經(jīng)典統(tǒng)計(jì)方法仍然是進(jìn)行統(tǒng)計(jì)分析的基石,其核心地位不可動(dòng)搖。所以,在大數(shù)據(jù)時(shí)代仍然要強(qiáng)化統(tǒng)計(jì)學(xué)的基本理論和方法,尤其是在長(zhǎng)期發(fā)展和實(shí)踐應(yīng)用中經(jīng)過(guò)驗(yàn)證的、成熟有效的經(jīng)典和現(xiàn)代統(tǒng)計(jì)方法,在大數(shù)據(jù)時(shí)代仍然沒(méi)有過(guò)時(shí),但需要結(jié)合大數(shù)據(jù)分析的需要對(duì)經(jīng)典統(tǒng)計(jì)方法進(jìn)行必要的發(fā)展和改進(jìn)。

大數(shù)據(jù)科學(xué)需要統(tǒng)計(jì)學(xué)與數(shù)學(xué)、計(jì)算機(jī)等學(xué)科的結(jié)合。亞馬遜大數(shù)據(jù)科學(xué)家John Rauser 認(rèn)為:“數(shù)據(jù)科學(xué)家是統(tǒng)計(jì)學(xué)家和計(jì)算機(jī)工程師的結(jié)合體”。為了滿(mǎn)足大數(shù)據(jù)時(shí)代的要求,統(tǒng)計(jì)學(xué)專(zhuān)業(yè)的課程設(shè)置需要進(jìn)行必要的調(diào)整。應(yīng)根據(jù)新時(shí)代人才培養(yǎng)的要求,增設(shè)與大數(shù)據(jù)前沿領(lǐng)域發(fā)展相關(guān)的課程,如計(jì)算機(jī)網(wǎng)絡(luò)和大數(shù)據(jù)相關(guān)的軟件應(yīng)用,同時(shí)要加大實(shí)驗(yàn)課和社會(huì)實(shí)踐課的比重,引導(dǎo)學(xué)生理解和掌握大數(shù)據(jù)概念、理論、技術(shù)和方法,培養(yǎng)其運(yùn)用大數(shù)據(jù)的相關(guān)分析工具解決實(shí)際問(wèn)題的能力。對(duì)于理論課程,除基本統(tǒng)計(jì)理論外,還應(yīng)開(kāi)設(shè)一些較為現(xiàn)代和深入的課程,如現(xiàn)代貝葉斯方法、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)挖掘、應(yīng)用隨機(jī)過(guò)程論等。另外,還應(yīng)開(kāi)設(shè)與大數(shù)據(jù)分析相關(guān)的關(guān)聯(lián)規(guī)則、決策樹(shù)、機(jī)器學(xué)習(xí)、支持向量機(jī)等課程。

為了培養(yǎng)與時(shí)代適應(yīng)的統(tǒng)計(jì)學(xué)人才,統(tǒng)計(jì)學(xué)專(zhuān)業(yè)教師應(yīng)不斷更新自身的知識(shí)結(jié)構(gòu)和價(jià)值觀念,改變認(rèn)識(shí)數(shù)據(jù)、收集數(shù)據(jù)和分析數(shù)據(jù)的思維,主動(dòng)學(xué)習(xí)和補(bǔ)充互聯(lián)網(wǎng)、現(xiàn)代數(shù)據(jù)分析技術(shù)、數(shù)據(jù)庫(kù)和數(shù)據(jù)挖掘技術(shù),使自己的知識(shí)體系不斷更新和提升,跟上時(shí)展的步伐。

在大數(shù)據(jù)時(shí)代,要注意培養(yǎng)學(xué)生適應(yīng)社會(huì)的能力。統(tǒng)計(jì)專(zhuān)業(yè)人才培養(yǎng)模式應(yīng)以提高本專(zhuān)業(yè)學(xué)生數(shù)據(jù)分析方面的能力,開(kāi)闊他們的視野,培養(yǎng)其適應(yīng)社會(huì)的能力。應(yīng)積極引導(dǎo)學(xué)生進(jìn)入實(shí)訓(xùn)場(chǎng)所動(dòng)手操作和鍛煉,嘗試以企事業(yè)單位的財(cái)政、金融、保險(xiǎn)、統(tǒng)計(jì)、咨詢(xún)和信息公司等部門(mén)為主構(gòu)建專(zhuān)業(yè)性教育實(shí)踐基地。鼓勵(lì)學(xué)生到大數(shù)據(jù)相關(guān)的機(jī)構(gòu)部門(mén)、產(chǎn)業(yè)園區(qū)和企業(yè)中去調(diào)查研究和實(shí)踐。此外,統(tǒng)計(jì)專(zhuān)業(yè)應(yīng)積極同其他專(zhuān)業(yè)進(jìn)行合作,聯(lián)合培養(yǎng)適應(yīng)新時(shí)代要求的數(shù)據(jù)分析人才。鑒于大數(shù)據(jù)對(duì)數(shù)據(jù)分析人員在計(jì)算機(jī)技術(shù)、行業(yè)認(rèn)知、業(yè)務(wù)知識(shí)、數(shù)據(jù)分析工具和方法的要求提高,統(tǒng)計(jì)學(xué)科應(yīng)主動(dòng)與計(jì)算機(jī)、經(jīng)濟(jì)學(xué)、管理學(xué)等相關(guān)學(xué)科合作,培養(yǎng)學(xué)生的計(jì)算機(jī)能力、專(zhuān)業(yè)素質(zhì)和業(yè)務(wù)修養(yǎng)。

“它山之石可以攻玉”,關(guān)于統(tǒng)計(jì)學(xué)專(zhuān)業(yè)的課程設(shè)置,可以參考和借鑒美國(guó)統(tǒng)計(jì)學(xué)會(huì)公布的統(tǒng)計(jì)學(xué)本科專(zhuān)業(yè)指導(dǎo)性教學(xué)綱要。根據(jù)該教學(xué)綱要,統(tǒng)計(jì)專(zhuān)業(yè)的課程設(shè)置應(yīng)該涵蓋五個(gè)模塊[7]:(1)統(tǒng)計(jì)方法與統(tǒng)計(jì)理論。建立統(tǒng)計(jì)模型并對(duì)模型的輸出結(jié)果進(jìn)行評(píng)價(jià),熟悉統(tǒng)計(jì)推斷,能夠從數(shù)據(jù)分析中得出恰當(dāng)?shù)慕Y(jié)論。(2)數(shù)據(jù)操作和統(tǒng)計(jì)計(jì)算。熟練使用一款專(zhuān)業(yè)統(tǒng)計(jì)軟件進(jìn)行探索性數(shù)據(jù)分析,發(fā)現(xiàn)和清洗數(shù)據(jù)中的錯(cuò)誤記錄,具有編程能力和算法思維,可以進(jìn)行各種數(shù)據(jù)操作,還應(yīng)掌握統(tǒng)計(jì)計(jì)算技術(shù),能夠進(jìn)行模擬研究。(3)數(shù)學(xué)基礎(chǔ)。熟練掌握微積分、線性代數(shù)、矩陣論、概率論和數(shù)理統(tǒng)計(jì)的基礎(chǔ)知識(shí)。(4)實(shí)踐訓(xùn)練和表達(dá)能力。具有良好的表達(dá)和交流能力,善于通過(guò)圖示和動(dòng)畫(huà)等聽(tīng)眾易于理解的方式展示分析結(jié)論,并且具有團(tuán)隊(duì)合作精神和項(xiàng)目領(lǐng)導(dǎo)能力。(5)特定領(lǐng)域的知識(shí)。掌握特定應(yīng)用領(lǐng)域的知識(shí),并用統(tǒng)計(jì)學(xué)特有的思維方法來(lái)分析和解決特定領(lǐng)域的實(shí)際問(wèn)題。

大數(shù)據(jù)時(shí)代是以數(shù)據(jù)為中心的時(shí)代,統(tǒng)計(jì)學(xué)專(zhuān)業(yè)的教育改革必須適應(yīng)這個(gè)時(shí)代的要求。統(tǒng)計(jì)數(shù)據(jù)分析中軟件應(yīng)用能力至關(guān)重要。在眾多統(tǒng)計(jì)軟件中推薦使用R和SAS軟件,因?yàn)镽是免費(fèi)開(kāi)源軟件,其統(tǒng)計(jì)建模、統(tǒng)計(jì)計(jì)算和可視化功能強(qiáng)大,更新迅速,是最新統(tǒng)計(jì)方法的主要平臺(tái),非常有利于培養(yǎng)學(xué)生的編程能力和知識(shí)更新能力,而SAS軟件被很多公司用于數(shù)據(jù)管理和數(shù)據(jù)分析,在實(shí)際應(yīng)用領(lǐng)域具有長(zhǎng)期而深遠(yuǎn)的影響,是數(shù)據(jù)分析不可或缺的專(zhuān)業(yè)統(tǒng)計(jì)軟件。當(dāng)然,教學(xué)中也可以嘗試使用其他專(zhuān)業(yè)統(tǒng)計(jì)軟件,例如經(jīng)濟(jì)統(tǒng)計(jì)專(zhuān)業(yè)學(xué)生也可使用SPSS軟件,但最好會(huì)使用SAS或R軟件。在加強(qiáng)軟件使用和編程能力的基礎(chǔ)上,應(yīng)加強(qiáng)學(xué)生統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)模擬能力的培養(yǎng)。在大數(shù)據(jù)時(shí)代,強(qiáng)調(diào)統(tǒng)計(jì)計(jì)算的重要性是大勢(shì)所趨。統(tǒng)計(jì)模擬技術(shù)是伴隨著高速計(jì)算機(jī)和信息技術(shù)的快速發(fā)展而廣泛應(yīng)用的現(xiàn)代技術(shù),可用來(lái)解決傳統(tǒng)學(xué)科領(lǐng)域中無(wú)法解決的問(wèn)題。例如,在計(jì)算技術(shù)飛速發(fā)展的今天,貝葉斯統(tǒng)計(jì)方法過(guò)去曾經(jīng)面臨的計(jì)算瓶頸正在逐漸消失,基于馬爾科夫鏈蒙特卡洛(MCMC)技術(shù)的統(tǒng)計(jì)模擬方法在數(shù)據(jù)分析中的強(qiáng)大威力正在日益顯現(xiàn)[8]。

參考文獻(xiàn):

[1] 劉春杰,大數(shù)據(jù)時(shí)代對(duì)當(dāng)代統(tǒng)計(jì)學(xué)教育的挑戰(zhàn),統(tǒng)計(jì)與決策,2015年,第8期。

[2] 孟生旺,袁衛(wèi),大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)教育,統(tǒng)計(jì)研究,2015年,第32卷4期。

[3] 葛虹,韓偉,大數(shù)據(jù)時(shí)代統(tǒng)計(jì)教育變革的SWOT分析與發(fā)展策略,統(tǒng)計(jì)與決策,2015年,第4期。

[4] 張海波,黃世祥,統(tǒng)計(jì)學(xué)專(zhuān)業(yè)學(xué)生大數(shù)據(jù)分析能力的培養(yǎng)方式選擇,統(tǒng)計(jì)與決策,2014年,第24期。

[5] 李衛(wèi)東,大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)科發(fā)展的影響,統(tǒng)計(jì)與決策,2014年,第13.期。

[6] 教育部高等學(xué)校統(tǒng)計(jì)類(lèi)專(zhuān)業(yè)教學(xué)指導(dǎo)委員會(huì).統(tǒng)計(jì)學(xué)專(zhuān)業(yè)教學(xué)單位.http:///category/信息公開(kāi)/教學(xué)單位,2013-11-15.

第4篇

關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)分析;統(tǒng)計(jì)學(xué)

大數(shù)據(jù)在如今社會(huì)已經(jīng)成為熱點(diǎn)詞匯,不僅在計(jì)算機(jī)領(lǐng)域,在其他各個(gè)行業(yè)都能夠得到運(yùn)用,為各個(gè)行業(yè)提供便捷,為了讓大數(shù)據(jù)能夠得到充分利用,下文將對(duì)大數(shù)據(jù)分析相關(guān)方面進(jìn)行討論。

一、大數(shù)據(jù)與大數(shù)據(jù)時(shí)代

(一)大數(shù)據(jù)大數(shù)據(jù)是在當(dāng)今科技飛速發(fā)展的情況下,一種新興的信息數(shù)據(jù)處理技術(shù)。隨著社會(huì)科技的進(jìn)步,各行各業(yè)對(duì)于數(shù)據(jù)的應(yīng)用也越來(lái)越廣泛,傳統(tǒng)的數(shù)據(jù)處理技術(shù)耗時(shí)較長(zhǎng)且精準(zhǔn)度較為低下,已經(jīng)不能滿(mǎn)足現(xiàn)代科技對(duì)數(shù)據(jù)應(yīng)用的要求。新時(shí)代的大數(shù)據(jù)系統(tǒng)具有超大的數(shù)據(jù)容量,同時(shí)兼容半結(jié)構(gòu)化與結(jié)構(gòu)化的數(shù)據(jù),遠(yuǎn)遠(yuǎn)超出傳統(tǒng)數(shù)據(jù)庫(kù)管理系統(tǒng)的管理能力。因此新的大數(shù)據(jù)技術(shù)就此誕生。大數(shù)據(jù)在發(fā)展過(guò)程中,具有比為鮮明的特點(diǎn)。與傳統(tǒng)數(shù)據(jù)處理技術(shù)相比,大數(shù)據(jù)具有數(shù)量龐大、多樣化、速率快、價(jià)值高的特點(diǎn)。在信息處理的速度不斷加快的當(dāng)今社會(huì),這樣的特點(diǎn)為大數(shù)據(jù)的廣泛應(yīng)用打下了堅(jiān)實(shí)基礎(chǔ)。由于數(shù)據(jù)的數(shù)量較為龐大,且各種數(shù)據(jù)近年來(lái)的增長(zhǎng)趨勢(shì)呈指數(shù)型,其數(shù)據(jù)的種類(lèi)和形式也各有不同。其次,合理利用大數(shù)據(jù)技術(shù),能夠在一定程度上降低成本,提高效率,因此,大數(shù)據(jù)處理各項(xiàng)關(guān)鍵技術(shù)的進(jìn)一步的開(kāi)發(fā)與利用已成為了提高自身效率,實(shí)現(xiàn)核心競(jìng)爭(zhēng)力的重中之重。

(二)大數(shù)據(jù)時(shí)代大數(shù)據(jù)時(shí)代是指在物聯(lián)網(wǎng)技術(shù)、計(jì)算機(jī)技術(shù)、數(shù)據(jù)信息處理技術(shù)的基礎(chǔ)上,通過(guò)互聯(lián)網(wǎng)途徑,大量收集并處理分析數(shù)據(jù)資源,而形成一種新型的信息時(shí)代。大數(shù)據(jù)時(shí)代的主要核心內(nèi)容是對(duì)龐大的數(shù)據(jù)體系進(jìn)行處理以發(fā)揮價(jià)值,從而提升數(shù)據(jù)分析效率以及數(shù)據(jù)應(yīng)用價(jià)值。大數(shù)據(jù)時(shí)代是由多種信息技術(shù)共同組成,可以有效地避免數(shù)據(jù)處理中不同步、使用不方便的情況發(fā)生,具有高效可靠的數(shù)據(jù)處理、整合、分析及匯總的功能。因此,大數(shù)據(jù)時(shí)代的新型數(shù)據(jù)處理技術(shù)可最大程度的對(duì)數(shù)據(jù)進(jìn)行分析與挖掘,極大提高處理數(shù)據(jù)的效率。

二、大數(shù)據(jù)時(shí)代與統(tǒng)計(jì)學(xué)

(一)大數(shù)據(jù)時(shí)代與統(tǒng)計(jì)學(xué)的關(guān)系統(tǒng)計(jì)工作是集數(shù)據(jù)的搜集、整理、分析和解釋為一體的系統(tǒng)的過(guò)程。大數(shù)據(jù)與統(tǒng)計(jì)二者互相依存,通過(guò)統(tǒng)計(jì)的方法和原理對(duì)數(shù)據(jù)進(jìn)行整理和分析,提高數(shù)據(jù)的精確度和適用度,以此來(lái)實(shí)現(xiàn)數(shù)據(jù)的價(jià)值和利用率。由此看來(lái),大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的聯(lián)系既緊密,又存在區(qū)別。大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的關(guān)系甚為密切,它們都是關(guān)于數(shù)字的學(xué)科。統(tǒng)計(jì)學(xué)為大數(shù)據(jù)提供了了施展方向,而大數(shù)據(jù)將統(tǒng)計(jì)學(xué)引領(lǐng)至更深更廣的空間。共性之一就是社會(huì)與數(shù)據(jù)。幾乎所有的行業(yè)與大數(shù)據(jù)都有著密切聯(lián)系,這些聯(lián)系或直接或間接,而人們正是通過(guò)獲取數(shù)據(jù)并進(jìn)行分析,從而才能得到商業(yè)知識(shí)和社會(huì)服務(wù)等能力。大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的區(qū)別。首先,信息規(guī)模不同。大數(shù)據(jù)的分析對(duì)象是與某事物有關(guān)聯(lián)的所有數(shù)據(jù),要求數(shù)據(jù)量龐大。統(tǒng)計(jì)學(xué)則是用樣本來(lái)分析和推斷總體的數(shù)量特征。在大數(shù)據(jù)時(shí)代,則可以通過(guò)各種方法和渠道獲得全面而又完整的的信息資料,從而完成更多從前無(wú)法完成的事情。其次,動(dòng)靜標(biāo)準(zhǔn)不同。數(shù)據(jù)經(jīng)過(guò)了搜集、整理、分析的過(guò)程就很有可能因?yàn)榫_性不足而被認(rèn)為失去了用處。而大數(shù)據(jù)時(shí)代,則不必再擔(dān)心這個(gè)問(wèn)題,數(shù)據(jù)的精確性和原始性不在被過(guò)分重視,人們可以接受復(fù)雜數(shù)據(jù)。第三,數(shù)據(jù)搜集形式不同。在以往數(shù)據(jù)搜集形式主要是抽樣調(diào)查,方法局限。而在大數(shù)據(jù)時(shí)代,特點(diǎn)是信息爆炸和互聯(lián)網(wǎng)飛速發(fā)展,這一情況得到改觀。最后,思維方式不同。大數(shù)據(jù)時(shí)代人們的思維發(fā)生轉(zhuǎn)變,人們開(kāi)始更多的關(guān)注事物的相關(guān)關(guān)聯(lián)。

(二)大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)研究工作的影響首先,大數(shù)據(jù)豐富了統(tǒng)計(jì)學(xué)的研究對(duì)象。在大數(shù)據(jù)時(shí)代,我們既可以以結(jié)構(gòu)化數(shù)據(jù)作為測(cè)量單位對(duì)文本、圖像和視頻等進(jìn)行分析,還可以對(duì)非結(jié)構(gòu)化數(shù)據(jù)實(shí)行分析。其次,大數(shù)據(jù)影響了統(tǒng)計(jì)學(xué)的工作進(jìn)程。統(tǒng)計(jì)數(shù)據(jù)需求豐富,原有的統(tǒng)計(jì)抽樣分析不能在適應(yīng)時(shí)代的發(fā)展,而現(xiàn)代科技方法如透過(guò)傳感器自動(dòng)收集數(shù)據(jù)等方法取代了傳統(tǒng)方法,更加便捷有效。

三、大數(shù)據(jù)數(shù)據(jù)分析理念

(一)統(tǒng)計(jì)學(xué)的應(yīng)用隨著現(xiàn)代科技的發(fā)展,傳統(tǒng)的大數(shù)據(jù)已經(jīng)不能滿(mǎn)足人們對(duì)數(shù)據(jù)處理的要求。傳統(tǒng)的抽樣數(shù)據(jù)調(diào)查不能滿(mǎn)足大數(shù)據(jù)的數(shù)據(jù)處理以及知識(shí)發(fā)現(xiàn)。因此,新技術(shù)及思維的引進(jìn)就顯得尤為重要。新的統(tǒng)計(jì)學(xué)思維以及知識(shí)的應(yīng)用能夠很大程度的提高大數(shù)據(jù)分析的效率。摒棄對(duì)傳統(tǒng)的小數(shù)據(jù)樣本的依賴(lài),不在用傳統(tǒng)的統(tǒng)計(jì)工具對(duì)數(shù)據(jù)進(jìn)行全部分析。而是對(duì)數(shù)據(jù)進(jìn)行針對(duì)性的分析,使數(shù)據(jù)分析更加精準(zhǔn),并且能夠更加全面的體現(xiàn)數(shù)據(jù)的價(jià)值。我們利用統(tǒng)計(jì)計(jì)算工具對(duì)數(shù)據(jù)進(jìn)行分析從而判斷數(shù)據(jù)的變化趨勢(shì)。統(tǒng)計(jì)學(xué)的應(yīng)用可以,為數(shù)據(jù)分析提供科學(xué)的參考依據(jù)。

第5篇

【論文關(guān)鍵詞】統(tǒng)計(jì)學(xué);統(tǒng)計(jì)思想;認(rèn)識(shí)

【論文摘要】所謂統(tǒng)計(jì)思想,就是在統(tǒng)計(jì)實(shí)際工作、統(tǒng)計(jì)學(xué)理論的應(yīng)用研究中,必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計(jì)思想主要包括均值思想、變異思想、估計(jì)思想、相關(guān)思想、擬合思想、檢驗(yàn)思想等思想。文章通過(guò)對(duì)統(tǒng)計(jì)思想的闡釋?zhuān)岢鲫P(guān)于統(tǒng)計(jì)思想認(rèn)識(shí)的三點(diǎn)思考。

1關(guān)于統(tǒng)計(jì)學(xué)

統(tǒng)計(jì)學(xué)是一門(mén)實(shí)質(zhì)性的社會(huì)科學(xué),既研究社會(huì)生活的客觀規(guī)律,也研究統(tǒng)計(jì)方法。統(tǒng)計(jì)學(xué)是繼承和發(fā)展基礎(chǔ)統(tǒng)計(jì)的理論成果,堅(jiān)持統(tǒng)計(jì)學(xué)的社會(huì)科學(xué)性質(zhì),使統(tǒng)計(jì)理論研究更接近統(tǒng)計(jì)工作實(shí)際,在國(guó)家和社會(huì)得到廣泛發(fā)展。

2統(tǒng)計(jì)學(xué)中的幾種統(tǒng)計(jì)思想

2.1統(tǒng)計(jì)思想的形成

統(tǒng)計(jì)思想不是天然形成的,需要經(jīng)歷統(tǒng)計(jì)觀念、統(tǒng)計(jì)意識(shí)、統(tǒng)計(jì)理念等階段。統(tǒng)計(jì)思想是根據(jù)人類(lèi)社會(huì)需求的變化而開(kāi)展各種統(tǒng)計(jì)實(shí)踐、統(tǒng)計(jì)理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計(jì)思想。

2.2比較常用的幾種統(tǒng)計(jì)思想

所謂統(tǒng)計(jì)思想,就是統(tǒng)計(jì)實(shí)際工作、統(tǒng)計(jì)學(xué)理論及應(yīng)用研究中必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計(jì)思想主要包括:均值思想、變異思想、估計(jì)思想、相關(guān)思想、擬合思想、檢驗(yàn)思想。現(xiàn)分述如下:

2.2.1均值思想

均值是對(duì)所要研究對(duì)象的簡(jiǎn)明而重要的代表。均值概念幾乎涉及所有統(tǒng)計(jì)學(xué)理論,是統(tǒng)計(jì)學(xué)的基本思想。均值思想也要求從總體上看問(wèn)題,但要求觀察其一般發(fā)展趨勢(shì),避免個(gè)別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。

2.2.2變異思想

統(tǒng)計(jì)研究同類(lèi)現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計(jì)方法就是要認(rèn)識(shí)事物數(shù)量方面的差異。統(tǒng)計(jì)學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對(duì)同類(lèi)事物特征的抽象和宏觀度量。

2.2.3估計(jì)思想

估計(jì)以樣本推測(cè)總體,是對(duì)同類(lèi)事物的由此及彼式的認(rèn)識(shí)方法。使用估計(jì)方法有一個(gè)預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計(jì)理論對(duì)置信程度的測(cè)量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。

2.2.4相關(guān)思想

事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個(gè)別事務(wù)所組成,這些個(gè)別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個(gè)體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。

2.2.5擬合思想

擬合是對(duì)不同類(lèi)型事物之間關(guān)系之表象的抽象。任何一個(gè)單一的關(guān)系必須依賴(lài)其他關(guān)系而存在,所有實(shí)際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對(duì)規(guī)律或趨勢(shì)的擬合。擬合的成果是模型,反映一般趨勢(shì)。趨勢(shì)表達(dá)的是“事物和關(guān)系的變化過(guò)程在數(shù)量上所體現(xiàn)的模式和基于此而預(yù)示的可能性”。

2.2.6檢驗(yàn)思想

統(tǒng)計(jì)方法總是歸納性的,其結(jié)論永遠(yuǎn)帶有一定的或然性,基于局部特征和規(guī)律所推廣出來(lái)的判斷不可能完全可信,檢驗(yàn)過(guò)程就是利用樣本的實(shí)際資料來(lái)檢驗(yàn)事先對(duì)總體某些數(shù)量特征的假設(shè)是否可信。

2.3統(tǒng)計(jì)思想的特點(diǎn)

作為一門(mén)應(yīng)用統(tǒng)計(jì)學(xué),它從數(shù)理統(tǒng)計(jì)學(xué)派汲取新的營(yíng)養(yǎng),并且越來(lái)越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來(lái)越密切,但在統(tǒng)計(jì)思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點(diǎn)能從以下四個(gè)方面體現(xiàn)出:(1)統(tǒng)計(jì)思想強(qiáng)調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)統(tǒng)計(jì)思想強(qiáng)調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)統(tǒng)計(jì)思想強(qiáng)調(diào)客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計(jì)思想強(qiáng)調(diào)定性分析與定量分析的統(tǒng)一。

3對(duì)統(tǒng)計(jì)思想的一些思考3.1要更正當(dāng)前存在的一些不正確的思想認(rèn)識(shí)

英國(guó)著名生物學(xué)家、統(tǒng)計(jì)學(xué)家高爾頓曾經(jīng)說(shuō)過(guò):“統(tǒng)計(jì)學(xué)具有處理復(fù)雜問(wèn)題的非凡能力,當(dāng)科學(xué)的探索者在前進(jìn)的過(guò)程中荊棘載途時(shí),唯有統(tǒng)計(jì)學(xué)可以幫助他們打開(kāi)一條通道”。但事實(shí)并非這么簡(jiǎn)單,因?yàn)槲覀兯媾R的現(xiàn)實(shí)問(wèn)題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜越科學(xué),在實(shí)際的分析研究中,喜歡簡(jiǎn)單問(wèn)題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實(shí),真正的科學(xué)是使復(fù)雜的問(wèn)題簡(jiǎn)單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計(jì)才是科學(xué),描述統(tǒng)計(jì)不是科學(xué),并延伸擴(kuò)大到只有數(shù)理統(tǒng)計(jì)是科學(xué)、社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)不是科學(xué)這樣的認(rèn)識(shí)。這種認(rèn)識(shí)是極其錯(cuò)誤的,至少是對(duì)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的無(wú)知。比利時(shí)數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計(jì)學(xué)應(yīng)用于人類(lèi)事物,試圖把統(tǒng)計(jì)學(xué)創(chuàng)建成改良社會(huì)的一種工具。經(jīng)濟(jì)學(xué)和人口統(tǒng)計(jì)學(xué)中的某些近代概念,如GNP、人口增長(zhǎng)率等等,均是凱特勒及其弟子們的遺產(chǎn)。

3.2要不斷拓展統(tǒng)計(jì)思維方式

統(tǒng)計(jì)學(xué)是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測(cè)到的數(shù)據(jù)信息(尤其是不完全甚至劣質(zhì)的信息)去產(chǎn)生新的知識(shí)或去驗(yàn)證一個(gè)假設(shè),即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結(jié)論。歸納推理是要在數(shù)據(jù)信息的基礎(chǔ)上透過(guò)偶然性去發(fā)現(xiàn)必然性。演繹推理是對(duì)統(tǒng)計(jì)認(rèn)識(shí)能力的深化,尤其是在根據(jù)必然性去研究和認(rèn)識(shí)偶然性方面,具有很大的作用。

3.3深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí)

任何統(tǒng)計(jì)研究都離不開(kāi)數(shù)據(jù)分析。因?yàn)檫@是得到統(tǒng)計(jì)研究結(jié)論的必要環(huán)節(jié)。雖然統(tǒng)計(jì)分析的形式隨時(shí)代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計(jì)分析的目的卻一直沒(méi)有改變。對(duì)統(tǒng)計(jì)數(shù)據(jù)分析的原因有以下三個(gè)方面:一是基于同樣的數(shù)據(jù)會(huì)得出不同、甚至相反的分析結(jié)論;二是我們所面對(duì)的分析數(shù)據(jù)有時(shí)是缺損的或存在不真實(shí)性;三是我們所面對(duì)的分析數(shù)據(jù)有時(shí)則又是海量的,讓人無(wú)從下手。雖然統(tǒng)計(jì)數(shù)據(jù)分析已經(jīng)經(jīng)歷了描述性數(shù)據(jù)分析(DDA)、推斷性數(shù)據(jù)分析(IDA)和探索性數(shù)據(jù)分析(EDA)等階段,分析的方法技術(shù)已經(jīng)有了質(zhì)的飛躍,但與人類(lèi)不斷提高的要求相比,存在的問(wèn)題似乎也越來(lái)越多。所以,我們必須深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí),圍繞“準(zhǔn)確解答特定問(wèn)題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開(kāi)展數(shù)據(jù)分析方法技術(shù)的研究。

新晨

參考文獻(xiàn):

[1]陳福貴.統(tǒng)計(jì)思想雛議[J]北京統(tǒng)計(jì),2004,(05).

[2]龐有貴.統(tǒng)計(jì)工作及統(tǒng)計(jì)思想[J]科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2004,(03).

第6篇

【摘要】所謂統(tǒng)計(jì)思想,就是在統(tǒng)計(jì)實(shí)際工作、統(tǒng)計(jì)學(xué)理論的應(yīng)用研究中,必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計(jì)思想主要包括均值思想、變異思想、估計(jì)思想、相關(guān)思想、擬合思想、檢驗(yàn)思想等思想。文章通過(guò)對(duì)統(tǒng)計(jì)思想的闡釋?zhuān)岢鲫P(guān)于統(tǒng)計(jì)思想認(rèn)識(shí)的三點(diǎn)思考。

一、關(guān)于統(tǒng)計(jì)學(xué)

統(tǒng)計(jì)學(xué)是一門(mén)實(shí)質(zhì)性的社會(huì)科學(xué),既研究社會(huì)生活的客觀規(guī)律,也研究統(tǒng)計(jì)方法。統(tǒng)計(jì)學(xué)是繼承和發(fā)展基礎(chǔ)統(tǒng)計(jì)的理論成果,堅(jiān)持統(tǒng)計(jì)學(xué)的社會(huì)科學(xué)性質(zhì),使統(tǒng)計(jì)理論研究更接近統(tǒng)計(jì)工作實(shí)際,在國(guó)家和社會(huì)得到廣泛發(fā)展。

二、統(tǒng)計(jì)學(xué)中的幾種統(tǒng)計(jì)思想

1統(tǒng)計(jì)思想的形成

統(tǒng)計(jì)思想不是天然形成的,需要經(jīng)歷統(tǒng)計(jì)觀念、統(tǒng)計(jì)意識(shí)、統(tǒng)計(jì)理念等階段。統(tǒng)計(jì)思想是根據(jù)人類(lèi)社會(huì)需求的變化而開(kāi)展各種統(tǒng)計(jì)實(shí)踐、統(tǒng)計(jì)理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計(jì)思想。

2比較常用的幾種統(tǒng)計(jì)思想

所謂統(tǒng)計(jì)思想,就是統(tǒng)計(jì)實(shí)際工作、統(tǒng)計(jì)學(xué)理論及應(yīng)用研究中必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計(jì)思想主要包括:均值思想、變異思想、估計(jì)思想、相關(guān)思想、擬合思想、檢驗(yàn)思想。現(xiàn)分述

2.1均值思想

均值是對(duì)所要研究對(duì)象的簡(jiǎn)明而重要的代表。均值概念幾乎涉及所有統(tǒng)計(jì)學(xué)理論,是統(tǒng)計(jì)學(xué)的基本思想。均值思想也要求從總體上看問(wèn)題,但要求觀察其一般發(fā)展趨勢(shì),避免個(gè)別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。

2.2變異思想

統(tǒng)計(jì)研究同類(lèi)現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計(jì)方法就是要認(rèn)識(shí)事物數(shù)量方面的差異。統(tǒng)計(jì)學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對(duì)同類(lèi)事物特征的抽象和宏觀度量。

2.3估計(jì)思想

估計(jì)以樣本推測(cè)總體,是對(duì)同類(lèi)事物的由此及彼式的認(rèn)識(shí)方法。使用估計(jì)方法有一個(gè)預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計(jì)理論對(duì)置信程度的測(cè)量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。

2.4相關(guān)思想

事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個(gè)別事務(wù)所組成,這些個(gè)別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個(gè)體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。

2.5擬合思想

擬合是對(duì)不同類(lèi)型事物之間關(guān)系之表象的抽象。任何一個(gè)單一的關(guān)系必須依賴(lài)其他關(guān)系而存在,所有實(shí)際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對(duì)規(guī)律或趨勢(shì)的擬合。擬合的成果是模型,反映一般趨勢(shì)。趨勢(shì)表達(dá)的是“事物和關(guān)系的變化過(guò)程在數(shù)量上所體現(xiàn)的模式和基于此而預(yù)示的可能性”。

2.6檢驗(yàn)思想

統(tǒng)計(jì)方法總是歸納性的,其結(jié)論永遠(yuǎn)帶有一定的或然性,基于局部特征和規(guī)律所推廣出來(lái)的判斷不可能完全可信,檢驗(yàn)過(guò)程就是利用樣本的實(shí)際資料來(lái)檢驗(yàn)事先對(duì)總體某些數(shù)量特征的假設(shè)是否可信。

3統(tǒng)計(jì)思想的特點(diǎn)

作為一門(mén)應(yīng)用統(tǒng)計(jì)學(xué),它從數(shù)理統(tǒng)計(jì)學(xué)派汲取新的營(yíng)養(yǎng),并且越來(lái)越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來(lái)越密切,但在統(tǒng)計(jì)思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點(diǎn)能從以下四個(gè)方面體現(xiàn)出:(1)統(tǒng)計(jì)思想強(qiáng)調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)統(tǒng)計(jì)思想強(qiáng)調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)統(tǒng)計(jì)思想強(qiáng)調(diào)客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計(jì)思想強(qiáng)調(diào)定性分析與定量分析的統(tǒng)一。

三、對(duì)統(tǒng)計(jì)思想的一些思考

1要更正當(dāng)前存在的一些不正確的思想認(rèn)識(shí)

英國(guó)著名生物學(xué)家、統(tǒng)計(jì)學(xué)家高爾頓曾經(jīng)說(shuō)過(guò):“統(tǒng)計(jì)學(xué)具有處理復(fù)雜問(wèn)題的非凡能力,當(dāng)科學(xué)的探索者在前進(jìn)的過(guò)程中荊棘載途時(shí),唯有統(tǒng)計(jì)學(xué)可以幫助他們打開(kāi)一條通道”。但事實(shí)并非這么簡(jiǎn)單,因?yàn)槲覀兯媾R的現(xiàn)實(shí)問(wèn)題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜越科學(xué),在實(shí)際的分析研究中,喜歡簡(jiǎn)單問(wèn)題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實(shí),真正的科學(xué)是使復(fù)雜的問(wèn)題簡(jiǎn)單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計(jì)才是科學(xué),描述統(tǒng)計(jì)不是科學(xué),并延伸擴(kuò)大到只有數(shù)理統(tǒng)計(jì)是科學(xué)、社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)不是科學(xué)這樣的認(rèn)識(shí)。這種認(rèn)識(shí)是極其錯(cuò)誤的,至少是對(duì)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的無(wú)知。比利時(shí)數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計(jì)學(xué)應(yīng)用于人類(lèi)事物,試圖把統(tǒng)計(jì)學(xué)創(chuàng)建成改良社會(huì)的一種工具。經(jīng)濟(jì)學(xué)和人口統(tǒng)計(jì)學(xué)中的某些近代概念,如GNP、人口增長(zhǎng)率等等,均是凱特勒及其弟子們的遺產(chǎn)。

2要不斷拓展統(tǒng)計(jì)思維方式

統(tǒng)計(jì)學(xué)是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測(cè)到的數(shù)據(jù)信息(尤其是不完全甚至劣質(zhì)的信息)去產(chǎn)生新的知識(shí)或去驗(yàn)證一個(gè)假設(shè),即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結(jié)論。歸納推理是要在數(shù)據(jù)信息的基礎(chǔ)上透過(guò)偶然性去發(fā)現(xiàn)必然性。演繹推理是對(duì)統(tǒng)計(jì)認(rèn)識(shí)能力的深化,尤其是在根據(jù)必然性去研究和認(rèn)識(shí)偶然性方面,具有很大的作用。

3深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí)

任何統(tǒng)計(jì)研究都離不開(kāi)數(shù)據(jù)分析。因?yàn)檫@是得到統(tǒng)計(jì)研究結(jié)論的必要環(huán)節(jié)。雖然統(tǒng)計(jì)分析的形式隨時(shí)代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計(jì)分析的目的卻一直沒(méi)有改變。對(duì)統(tǒng)計(jì)數(shù)據(jù)分析的原因有以下三個(gè)方面:一是基于同樣的數(shù)據(jù)會(huì)得出不同、甚至相反的分析結(jié)論;二是我們所面對(duì)的分析數(shù)據(jù)有時(shí)是缺損的或存在不真實(shí)性;三是我們所面對(duì)的分析數(shù)據(jù)有時(shí)則又是海量的,讓人無(wú)從下手。雖然統(tǒng)計(jì)數(shù)據(jù)分析已經(jīng)經(jīng)歷了描述性數(shù)據(jù)分析(DDA)、推斷性數(shù)據(jù)分析(IDA)和探索性數(shù)據(jù)分析(EDA)等階段,分析的方法技術(shù)已經(jīng)有了質(zhì)的飛躍,但與人類(lèi)不斷提高的要求相比,存在的問(wèn)題似乎也越來(lái)越多。所以,我們必須深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí),圍繞“準(zhǔn)確解答特定問(wèn)題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開(kāi)展數(shù)據(jù)分析方法技術(shù)的研究。

參考文獻(xiàn):

陳福貴.統(tǒng)計(jì)思想雛議[J]北京統(tǒng)計(jì),2004,(05).

龐有貴.統(tǒng)計(jì)工作及統(tǒng)計(jì)思想[J]科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2004,(03).

第7篇

1關(guān)于統(tǒng)計(jì)學(xué)

統(tǒng)計(jì)學(xué)是一門(mén)實(shí)質(zhì)性的社會(huì)科學(xué),既研究社會(huì)生活的客觀規(guī)律,也研究統(tǒng)計(jì)方法。統(tǒng)計(jì)學(xué)是繼承和發(fā)展基礎(chǔ)統(tǒng)計(jì)的理論成果,堅(jiān)持統(tǒng)計(jì)學(xué)的社會(huì)科學(xué)性質(zhì),使統(tǒng)計(jì)理論研究更接近統(tǒng)計(jì)工作實(shí)際,在國(guó)家和社會(huì)得到廣泛發(fā)展。

2統(tǒng)計(jì)學(xué)中的幾種統(tǒng)計(jì)思想

2.1統(tǒng)計(jì)思想的形成

統(tǒng)計(jì)思想不是天然形成的,需要經(jīng)歷統(tǒng)計(jì)觀念、統(tǒng)計(jì)意識(shí)、統(tǒng)計(jì)理念等階段。統(tǒng)計(jì)思想是根據(jù)人類(lèi)社會(huì)需求的變化而開(kāi)展各種統(tǒng)計(jì)實(shí)踐、統(tǒng)計(jì)理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計(jì)思想。

2.2比較常用的幾種統(tǒng)計(jì)思想

所謂統(tǒng)計(jì)思想,就是統(tǒng)計(jì)實(shí)際工作、統(tǒng)計(jì)學(xué)理論及應(yīng)用研究中必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計(jì)思想主要包括:均值思想、變異思想、估計(jì)思想、相關(guān)思想、擬合思想、檢驗(yàn)思想。現(xiàn)分述如下:

2.2.1均值思想

均值是對(duì)所要研究對(duì)象的簡(jiǎn)明而重要的代表。均值概念幾乎涉及所有統(tǒng)計(jì)學(xué)理論,是統(tǒng)計(jì)學(xué)的基本思想。均值思想也要求從總體上看問(wèn)題,但要求觀察其一般發(fā)展趨勢(shì),避免個(gè)別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。

2.2.2變異思想

統(tǒng)計(jì)研究同類(lèi)現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計(jì)方法就是要認(rèn)識(shí)事物數(shù)量方面的差異。統(tǒng)計(jì)學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對(duì)同類(lèi)事物特征的抽象和宏觀度量。

2.2.3估計(jì)思想

估計(jì)以樣本推測(cè)總體,是對(duì)同類(lèi)事物的由此及彼式的認(rèn)識(shí)方法。使用估計(jì)方法有一個(gè)預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計(jì)理論對(duì)置信程度的測(cè)量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。

2.2.4相關(guān)思想

事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個(gè)別事務(wù)所組成,這些個(gè)別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個(gè)體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。

2.2.5擬合思想

擬合是對(duì)不同類(lèi)型事物之間關(guān)系之表象的抽象。任何一個(gè)單一的關(guān)系必須依賴(lài)其他關(guān)系而存在,所有實(shí)際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對(duì)規(guī)律或趨勢(shì)的擬合。擬合的成果是模型,反映一般趨勢(shì)。趨勢(shì)表達(dá)的是“事物和關(guān)系的變化過(guò)程在數(shù)量上所體現(xiàn)的模式和基于此而預(yù)示的可能性”。

2.2.6檢驗(yàn)思想

統(tǒng)計(jì)方法總是歸納性的,其結(jié)論永遠(yuǎn)帶有一定的或然性,基于局部特征和規(guī)律所推廣出來(lái)的判斷不可能完全可信,檢驗(yàn)過(guò)程就是利用樣本的實(shí)際資料來(lái)檢驗(yàn)事先對(duì)總體某些數(shù)量特征的假設(shè)是否可信。

2.3統(tǒng)計(jì)思想的特點(diǎn)

作為一門(mén)應(yīng)用統(tǒng)計(jì)學(xué),它從數(shù)理統(tǒng)計(jì)學(xué)派汲取新的營(yíng)養(yǎng),并且越來(lái)越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來(lái)越密切,但在統(tǒng)計(jì)思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點(diǎn)能從以下四個(gè)方面體現(xiàn)出:(1)統(tǒng)計(jì)思想強(qiáng)調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)統(tǒng)計(jì)思想強(qiáng)調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)統(tǒng)計(jì)思想強(qiáng)調(diào)客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計(jì)思想強(qiáng)調(diào)定性分析與定量分析的統(tǒng)一。

3對(duì)統(tǒng)計(jì)思想的一些思考

3.1要更正當(dāng)前存在的一些不正確的思想認(rèn)識(shí)

英國(guó)著名生物學(xué)家、統(tǒng)計(jì)學(xué)家高爾頓曾經(jīng)說(shuō)過(guò):“統(tǒng)計(jì)學(xué)具有處理復(fù)雜問(wèn)題的非凡能力,當(dāng)科學(xué)的探索者在前進(jìn)的過(guò)程中荊棘載途時(shí),唯有統(tǒng)計(jì)學(xué)可以幫助他們打開(kāi)一條通道”。但事實(shí)并非這么簡(jiǎn)單,因?yàn)槲覀兯媾R的現(xiàn)實(shí)問(wèn)題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜越科學(xué),在實(shí)際的分析研究中,喜歡簡(jiǎn)單問(wèn)題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實(shí),真正的科學(xué)是使復(fù)雜的問(wèn)題簡(jiǎn)單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計(jì)才是科學(xué),描述統(tǒng)計(jì)不是科學(xué),并延伸擴(kuò)大到只有數(shù)理統(tǒng)計(jì)是科學(xué)、社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)不是科學(xué)這樣的認(rèn)識(shí)。這種認(rèn)識(shí)是極其錯(cuò)誤的,至少是對(duì)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的無(wú)知。比利時(shí)數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計(jì)學(xué)應(yīng)用于人類(lèi)事物,試圖把統(tǒng)計(jì)學(xué)創(chuàng)建成改良社會(huì)的一種工具。經(jīng)濟(jì)學(xué)和人口統(tǒng)計(jì)學(xué)中的某些近代概念,如GNP、人口增長(zhǎng)率等等,均是凱特勒及其弟子們的遺產(chǎn)。

3.2要不斷拓展統(tǒng)計(jì)思維方式

統(tǒng)計(jì)學(xué)是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測(cè)到的數(shù)據(jù)信息(尤其是不完全甚至劣質(zhì)的信息)去產(chǎn)生新的知識(shí)或去驗(yàn)證一個(gè)假設(shè),即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結(jié)論。歸納推理是要在數(shù)據(jù)信息的基礎(chǔ)上透過(guò)偶然性去發(fā)現(xiàn)必然性。演繹推理是對(duì)統(tǒng)計(jì)認(rèn)識(shí)能力的深化,尤其是在根據(jù)必然性去研究和認(rèn)識(shí)偶然性方面,具有很大的作用。

3.3深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí)

任何統(tǒng)計(jì)研究都離不開(kāi)數(shù)據(jù)分析。因?yàn)檫@是得到統(tǒng)計(jì)研究結(jié)論的必要環(huán)節(jié)。雖然統(tǒng)計(jì)分析的形式隨時(shí)代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計(jì)分析的目的卻一直沒(méi)有改變。對(duì)統(tǒng)計(jì)數(shù)據(jù)分析的原因有以下三個(gè)方面:一是基于同樣的數(shù)據(jù)會(huì)得出不同、甚至相反的分析結(jié)論;二是我們所面對(duì)的分析數(shù)據(jù)有時(shí)是缺損的或存在不真實(shí)性;三是我們所面對(duì)的分析數(shù)據(jù)有時(shí)則又是海量的,讓人無(wú)從下手。雖然統(tǒng)計(jì)數(shù)據(jù)分析已經(jīng)經(jīng)歷了描述性數(shù)據(jù)分析(DDA)、推斷性數(shù)據(jù)分析(IDA)和探索性數(shù)據(jù)分析(EDA)等階段,分析的方法技術(shù)已經(jīng)有了質(zhì)的飛躍,但與人類(lèi)不斷提高的要求相比,存在的問(wèn)題似乎也越來(lái)越多。所以,我們必須深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí),圍繞“準(zhǔn)確解答特定問(wèn)題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開(kāi)展數(shù)據(jù)分析方法技術(shù)的研究。

論文摘要】所謂統(tǒng)計(jì)思想,就是在統(tǒng)計(jì)實(shí)際工作、統(tǒng)計(jì)學(xué)理論的應(yīng)用研究中,必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計(jì)思想主要包括均值思想、變異思想、估計(jì)思想、相關(guān)思想、擬合思想、檢驗(yàn)思想等思想。文章通過(guò)對(duì)統(tǒng)計(jì)思想的闡釋?zhuān)岢鲫P(guān)于統(tǒng)計(jì)思想認(rèn)識(shí)的三點(diǎn)思考。

參考文獻(xiàn):

[1]陳福貴.統(tǒng)計(jì)思想雛議[J]北京統(tǒng)計(jì),2004,(05).

[2]龐有貴.統(tǒng)計(jì)工作及統(tǒng)計(jì)思想[J]科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2004,(03).

第8篇

關(guān)鍵詞:統(tǒng)計(jì)測(cè)度;統(tǒng)計(jì)學(xué);大數(shù)據(jù);數(shù)據(jù)科學(xué);

作者簡(jiǎn)介:李金昌,男,50歲,浙江義烏人。浙江財(cái)經(jīng)大學(xué)校長(zhǎng),統(tǒng)計(jì)學(xué)教授,博士生導(dǎo)師。研究方向?yàn)榻?jīng)濟(jì)統(tǒng)計(jì)學(xué),統(tǒng)計(jì)理論與方法,抽樣技術(shù),政府統(tǒng)計(jì)等。

最近兩年,統(tǒng)計(jì)學(xué)界對(duì)大數(shù)據(jù)問(wèn)題所進(jìn)行的理論探討逐漸增多,視角也各有千秋,引起了一些共鳴。圍繞大數(shù)據(jù)問(wèn)題,由統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)等學(xué)科共同支撐的數(shù)據(jù)科學(xué)開(kāi)始形成。但大數(shù)據(jù)畢竟是一個(gè)新課題,因此遠(yuǎn)未達(dá)到對(duì)其有一個(gè)系統(tǒng)完整的認(rèn)識(shí),仍然需要從不同的方面加以研究,其中有一個(gè)重要但又容易被忽視的問(wèn)題,即統(tǒng)計(jì)測(cè)度問(wèn)題,值得去探討。

一、什么是統(tǒng)計(jì)測(cè)度

漢語(yǔ)上,測(cè)度是指猜測(cè)、揣度、估計(jì)。數(shù)學(xué)上,測(cè)度是一個(gè)函數(shù),它對(duì)一個(gè)給定集合的某些子集指定一個(gè)數(shù),這個(gè)數(shù)可以比作大小、體積、概率等等。通俗地說(shuō),測(cè)度把每個(gè)集合映射到非負(fù)實(shí)數(shù)來(lái)規(guī)定這個(gè)集合的大小:空集的測(cè)度是0;集合變大時(shí)測(cè)度至少不會(huì)減小(因?yàn)橐由献兇蟮牟糠值臏y(cè)度,而它是非負(fù)的)。

除了數(shù)學(xué)角度的測(cè)度論,查閱國(guó)內(nèi)文獻(xiàn)資料,帶有測(cè)度這個(gè)詞匯的文獻(xiàn)不少,但專(zhuān)門(mén)針對(duì)統(tǒng)計(jì)測(cè)度(或測(cè)度)內(nèi)涵的討論幾乎沒(méi)有。一些對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行分析測(cè)度的文獻(xiàn),例如新型工業(yè)化進(jìn)程測(cè)度、貨幣流動(dòng)性測(cè)度、全面小康社會(huì)發(fā)展進(jìn)程測(cè)度、收入分配公平性測(cè)度、技術(shù)效率測(cè)度、人力資本測(cè)度、金融風(fēng)險(xiǎn)測(cè)度、產(chǎn)業(yè)關(guān)聯(lián)測(cè)度等等,所做的測(cè)度都是再測(cè)度,均不對(duì)測(cè)度本身進(jìn)行討論。查閱國(guó)外文獻(xiàn)資料(關(guān)鍵詞:measurement),也同樣存在這樣的問(wèn)題,只能收集到一些比較零散的表述。LudwikFinkelstein(1975)[1]認(rèn)為,在我們對(duì)事物或現(xiàn)象進(jìn)行描述時(shí),測(cè)度可以被定義為對(duì)現(xiàn)實(shí)世界中某一現(xiàn)象的個(gè)體屬性或特征進(jìn)行量化的過(guò)程。JamesT.Townsend和F.GregoryAshby(1984)[2]認(rèn)為,如果按照極端的觀點(diǎn),那么統(tǒng)計(jì)分析中的基本測(cè)度理論的含義仍然是存在爭(zhēng)議的。LudwikFinkelstein(2003)[3]指出,測(cè)度在那些原來(lái)尚未得到卓有成效或廣泛應(yīng)用的領(lǐng)域,也已取得了明顯的進(jìn)步,社會(huì)、政治、經(jīng)濟(jì)和行為科學(xué)正在更大程度地利用定量技術(shù);測(cè)度是現(xiàn)代思維的一種實(shí)際有效的工具,是我們借以描述世界的一種方法。GiovanniBattistaRossi(2007)[4]認(rèn)為,用以表示測(cè)度結(jié)果的,是數(shù)字或者數(shù)字符號(hào)。LucaMari(2013)[5]認(rèn)為,測(cè)度的基礎(chǔ)特征是被公認(rèn)為世界上獲取并正式表達(dá)信息的基本方法,這讓它成為一種跨學(xué)科的工具。LudwikFinkelstein(2014)[6]指出,在自然科學(xué)技術(shù)中,測(cè)度的重要性不可否認(rèn),它是科學(xué)調(diào)查和發(fā)現(xiàn)必不可少的工具,它可將宇宙中的復(fù)雜現(xiàn)象用精確、簡(jiǎn)潔和普遍的數(shù)學(xué)語(yǔ)言來(lái)描述。

那么,到底什么是統(tǒng)計(jì)測(cè)度呢?目前沒(méi)有一個(gè)統(tǒng)一的定義。本文認(rèn)為,統(tǒng)計(jì)測(cè)度具有不同于測(cè)度的意義,并且大大超越數(shù)學(xué)上的界定,即它具有數(shù)學(xué)定義的一般屬性,但又不受制于函數(shù)表現(xiàn)形式,因?yàn)榻y(tǒng)計(jì)測(cè)度所要面對(duì)的是現(xiàn)實(shí)世界,實(shí)際問(wèn)題要比理論上可以定義的問(wèn)題復(fù)雜得多。按照我們的理解,統(tǒng)計(jì)測(cè)度就是用一定的符號(hào)和數(shù)字,用一定的形式和載體,對(duì)所研究的現(xiàn)象或事物的特征進(jìn)行量化反映,表現(xiàn)為可用于統(tǒng)計(jì)分析的數(shù)據(jù)的過(guò)程。它應(yīng)該具有這樣一些屬性:以實(shí)際現(xiàn)象為測(cè)度對(duì)象,測(cè)度結(jié)果具有實(shí)際意義;以量化為目的,把信息轉(zhuǎn)化為數(shù)量,提供人們?nèi)菀桌斫獾亩拷Y(jié)論;個(gè)體特征的測(cè)度符合形成總體定量結(jié)論的要求,同時(shí)能夠體現(xiàn)個(gè)體差異。可以發(fā)現(xiàn),統(tǒng)計(jì)測(cè)度需要借用數(shù)學(xué)工具,但更重要的是對(duì)具體測(cè)度現(xiàn)象本質(zhì)特征的認(rèn)識(shí)和掌握。

統(tǒng)計(jì)測(cè)度可以從若干不同角度進(jìn)行分類(lèi)。邱東教授(2012)[7]曾在“宏觀測(cè)度的邊界悖律及其意義”一文中,從邊界的角度對(duì)宏觀測(cè)度進(jìn)行了分類(lèi):一是因事物本身可測(cè)度性而形成的邊界,即本體論意義上的測(cè)度邊界;再一是由人的認(rèn)知能力而形成的邊界,即認(rèn)識(shí)論意義上的測(cè)度邊界;第三則是由統(tǒng)計(jì)相關(guān)性偏好和投入約束而形成的邊界,即操作意義上的測(cè)度邊界。這三條測(cè)度邊界,應(yīng)該以本體論意義的測(cè)度邊界最大,認(rèn)識(shí)論意義的測(cè)度邊界次之,而操作意義的測(cè)度邊界最小。這樣的分類(lèi),對(duì)于我們正確理解統(tǒng)計(jì)測(cè)度的內(nèi)涵很有幫助。受此啟發(fā),筆者認(rèn)為統(tǒng)計(jì)測(cè)度還可以有如下分類(lèi):

1.從測(cè)度的實(shí)現(xiàn)形式看,可以分為原始測(cè)度和再測(cè)度。原始測(cè)度也可以稱(chēng)為直接測(cè)度,它通過(guò)對(duì)測(cè)度對(duì)象進(jìn)行直接測(cè)度來(lái)獲取數(shù)據(jù),例如清點(diǎn)庫(kù)存物品數(shù)量、丈量作物播種面積、觀察培育細(xì)菌數(shù)目、檢測(cè)藥物成分等獲得的數(shù)據(jù),以及各種登記、記錄的原始數(shù)據(jù)等等。再測(cè)度也稱(chēng)為間接測(cè)度,它以其他已知的測(cè)度數(shù)據(jù)為基礎(chǔ)去計(jì)算、推算或預(yù)測(cè)所需的未知數(shù)據(jù),例如根據(jù)GDP和人口數(shù)測(cè)度人均GDP、根據(jù)人口普查分年齡人口數(shù)據(jù)測(cè)度老齡化系數(shù)和社會(huì)負(fù)擔(dān)系數(shù)、根據(jù)相關(guān)指標(biāo)數(shù)據(jù)測(cè)度CPI的變化等等。復(fù)雜的再測(cè)度則需要借助相應(yīng)的統(tǒng)計(jì)模型作為工具,因?yàn)樗鼘?shí)際上是對(duì)相關(guān)變量之間的關(guān)系進(jìn)行定量反映。從兩者關(guān)系上看,原始測(cè)度是基礎(chǔ),是根本,沒(méi)有科學(xué)的原始測(cè)度就不會(huì)有可靠的再測(cè)度;再測(cè)度則是測(cè)度功能提升的必然要求,以解決原始測(cè)度不能解決的問(wèn)題。

2.從測(cè)度的計(jì)量方式看,可以分為自然測(cè)度、物理測(cè)度、化學(xué)測(cè)度、時(shí)間測(cè)度和價(jià)值測(cè)度。自然測(cè)度是利用現(xiàn)象的自然屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如人口規(guī)模、企業(yè)數(shù)量等的測(cè)度,采用自然計(jì)量單位;物理測(cè)度是利用現(xiàn)象的物理屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如公路長(zhǎng)度、作物播種面積、天然氣產(chǎn)量等的測(cè)度,采用物理計(jì)量單位;化學(xué)測(cè)度是利用現(xiàn)象的化學(xué)屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如醫(yī)學(xué)、生物學(xué)中化學(xué)合成物的成分結(jié)構(gòu)測(cè)度,采用百分?jǐn)?shù)、千分?jǐn)?shù)或特定標(biāo)識(shí)為計(jì)量單位;時(shí)間測(cè)度是利用現(xiàn)象的時(shí)間屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如勞動(dòng)用工、閑暇時(shí)間等測(cè)度,采用時(shí)間計(jì)量單位;價(jià)值測(cè)度是利用現(xiàn)象的價(jià)值屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如勞動(dòng)報(bào)酬、經(jīng)濟(jì)活動(dòng)成果等測(cè)度,采用貨幣計(jì)量單位。在這些測(cè)度計(jì)量方式中,價(jià)值測(cè)度因最具有綜合功能而應(yīng)用最為廣泛。

3.從測(cè)度的方法看,可以分為計(jì)數(shù)測(cè)度、測(cè)量測(cè)度、實(shí)驗(yàn)測(cè)度、定義測(cè)度和模型測(cè)度。計(jì)數(shù)測(cè)度是一種通過(guò)觀測(cè)計(jì)數(shù)來(lái)獲得數(shù)據(jù)的方法,最為簡(jiǎn)單,一般用于自然測(cè)度或時(shí)間測(cè)度;測(cè)量測(cè)度是一種根據(jù)物理或化學(xué)規(guī)制對(duì)現(xiàn)象進(jìn)行測(cè)量、測(cè)算來(lái)獲得數(shù)據(jù)的方法,一般用于物理測(cè)度或化學(xué)測(cè)度;實(shí)驗(yàn)測(cè)度是一種按照科學(xué)實(shí)驗(yàn)原理、通過(guò)觀察實(shí)驗(yàn)對(duì)象在既定條件下的反應(yīng)來(lái)獲得數(shù)據(jù)的方法,一般與測(cè)量測(cè)度相結(jié)合,用于獲取科學(xué)研究數(shù)據(jù);定義測(cè)度也可以稱(chēng)之為指標(biāo)測(cè)度,是一種通過(guò)探究現(xiàn)象的本質(zhì)特征和活動(dòng)規(guī)律、歸納出表現(xiàn)其數(shù)量特征的范疇、給出統(tǒng)計(jì)指標(biāo)定義(包括內(nèi)容、口徑、計(jì)算方法和表現(xiàn)形式等)來(lái)獲取數(shù)據(jù)的方法,最常用于價(jià)值測(cè)度,也用于其他形式的測(cè)度。可以說(shuō),定義測(cè)度方法應(yīng)用最為廣泛,但也最為困難。模型測(cè)度是一種根據(jù)現(xiàn)象與現(xiàn)象之間的內(nèi)在聯(lián)系關(guān)系、或者現(xiàn)象自身的發(fā)展變化規(guī)律,通過(guò)建立一定的方程模型來(lái)獲取數(shù)據(jù)的方法。前面三種統(tǒng)計(jì)測(cè)度方法基本上都屬于直接測(cè)度,定義測(cè)度既可能是直接測(cè)度、也可能是間接測(cè)度,而模型測(cè)度都屬于間接測(cè)度方法。

4.從測(cè)度的維度看,可以分為單一測(cè)度與多維測(cè)度。單一測(cè)度是指采用單一的方式方法對(duì)所研究現(xiàn)象或事物進(jìn)行單一角度的測(cè)度,獲得單一的數(shù)據(jù)。多維測(cè)度是指對(duì)所研究現(xiàn)象或事物進(jìn)行多角度的測(cè)度,測(cè)度過(guò)程中可能需要采用多種測(cè)度方法和計(jì)量方式,例如多指標(biāo)綜合評(píng)價(jià)就需要借助統(tǒng)計(jì)指標(biāo)體系對(duì)評(píng)價(jià)對(duì)象進(jìn)行多角度的測(cè)度。顯然,單一測(cè)度是多維測(cè)度的基礎(chǔ)。

二、統(tǒng)計(jì)測(cè)度是統(tǒng)計(jì)學(xué)的立足之本

首先,從統(tǒng)計(jì)學(xué)的發(fā)展歷史看,是統(tǒng)計(jì)測(cè)度使統(tǒng)計(jì)學(xué)破繭而出。為什么主流觀點(diǎn)認(rèn)為政治算術(shù)是統(tǒng)計(jì)學(xué)的起源而不是國(guó)勢(shì)學(xué)?正是因?yàn)橥づ涞谑状尾捎媒y(tǒng)計(jì)測(cè)度的方式進(jìn)行了國(guó)家實(shí)力的統(tǒng)計(jì)分析和有關(guān)推算,得出了令人信服的結(jié)論。威廉·配第在1693年出版的《政治算術(shù)》[8]中寫(xiě)道“因?yàn)楹椭皇褂帽容^級(jí)或最高級(jí)的詞匯以及單純作思維的論證相反,我卻采用了這樣的方法(作為我很久以來(lái)就想建立的政治算術(shù)的一個(gè)范例),即用數(shù)字、重量和尺度的詞匯來(lái)表達(dá)我自己想說(shuō)的問(wèn)題,只進(jìn)行能訴諸人們的感官的論證和考察在性質(zhì)上有可見(jiàn)的根據(jù)的原因”,這一觀點(diǎn)在統(tǒng)計(jì)學(xué)的發(fā)展過(guò)程中產(chǎn)生了非常重要的影響。他的這段話(huà)雖然沒(méi)有出現(xiàn)測(cè)度一詞,但卻道出了測(cè)度的本質(zhì),即讓事物變得明白、變得有根據(jù),因?yàn)椤皵?shù)字、重量和尺度”就是測(cè)度、就是根據(jù),用“數(shù)字、重量和尺度的詞匯來(lái)表達(dá)想說(shuō)的問(wèn)題”就是一種測(cè)度的思想,盡管測(cè)度的方式方法還很簡(jiǎn)單。相反,國(guó)勢(shì)學(xué)雖然提出了歸納法這一統(tǒng)計(jì)學(xué)的基本方法并首創(chuàng)了統(tǒng)計(jì)學(xué)一詞,但由于沒(méi)有采用統(tǒng)計(jì)測(cè)度的方式進(jìn)行國(guó)勢(shì)問(wèn)題的研究而難以修成正果。正如邱東教授[7]所說(shuō):“在配第之前,統(tǒng)計(jì)學(xué)的研究對(duì)象雖然是國(guó)家的態(tài)勢(shì),但它在方法論上只是定性言說(shuō)。一個(gè)國(guó)家的財(cái)富總量在本體論意義上是可以測(cè)度的。然而只是到了配第時(shí)期,人類(lèi)才想到了要測(cè)度它,并發(fā)明了如何測(cè)度的基本方法。政治算術(shù),即開(kāi)創(chuàng)期的經(jīng)濟(jì)統(tǒng)計(jì)學(xué),實(shí)現(xiàn)了從無(wú)到有的轉(zhuǎn)變,大大擴(kuò)展了宏觀測(cè)度的認(rèn)識(shí)論邊界,因而才具有了統(tǒng)計(jì)學(xué)范式創(chuàng)新的革命性意義。”同樣,格朗特的《關(guān)于死亡表的自然觀察和政治觀察》也是人口統(tǒng)計(jì)測(cè)度方面的經(jīng)典之作,無(wú)論是原始測(cè)度還是再測(cè)度,都給后人留下了寶貴的財(cái)富。之后,統(tǒng)計(jì)學(xué)就是沿著如何更加科學(xué)、準(zhǔn)確測(cè)度世界這一主線而發(fā)展的。筆者曾在“從政治算術(shù)到大數(shù)據(jù)分析”一文[9],對(duì)數(shù)據(jù)的變化與統(tǒng)計(jì)分析方法的發(fā)展進(jìn)行了粗淺的歸納,其主題實(shí)際上就是統(tǒng)計(jì)測(cè)度問(wèn)題。

其次,從統(tǒng)計(jì)學(xué)的研究對(duì)象上看,統(tǒng)計(jì)測(cè)度是體現(xiàn)統(tǒng)計(jì)學(xué)數(shù)量性特征的前提條件。統(tǒng)計(jì)學(xué)的研究對(duì)象是現(xiàn)象的數(shù)量方面,或者說(shuō)統(tǒng)計(jì)學(xué)是關(guān)于如何收集和分析數(shù)據(jù)的科學(xué)。統(tǒng)計(jì)數(shù)據(jù)從何而來(lái)?從統(tǒng)計(jì)測(cè)度中來(lái)。數(shù)據(jù)不同于數(shù)字,數(shù)字是統(tǒng)計(jì)測(cè)度的符號(hào),數(shù)據(jù)是統(tǒng)計(jì)測(cè)度的結(jié)果,這也正是統(tǒng)計(jì)學(xué)區(qū)別于數(shù)學(xué)之處。所以說(shuō),數(shù)據(jù)的本質(zhì)問(wèn)題就是統(tǒng)計(jì)測(cè)度問(wèn)題,故此統(tǒng)計(jì)測(cè)度是統(tǒng)計(jì)學(xué)的基本問(wèn)題。這里重點(diǎn)討論兩個(gè)問(wèn)題:一是統(tǒng)計(jì)測(cè)度與統(tǒng)計(jì)指標(biāo)的關(guān)系,二是統(tǒng)計(jì)測(cè)度面臨的新問(wèn)題。關(guān)于第一個(gè)問(wèn)題,本文認(rèn)為統(tǒng)計(jì)測(cè)度與統(tǒng)計(jì)指標(biāo)是一個(gè)事物的兩個(gè)方面,這個(gè)事物就是數(shù)據(jù)。統(tǒng)計(jì)指標(biāo)法是統(tǒng)計(jì)學(xué)的基本方法之一,盡管前面對(duì)統(tǒng)計(jì)測(cè)度從方式方法上進(jìn)行了分類(lèi),但從廣義上說(shuō)所有統(tǒng)計(jì)測(cè)度都是定義測(cè)度,都表現(xiàn)為指標(biāo)。也就是說(shuō),任何統(tǒng)計(jì)測(cè)度———不論是直接測(cè)度還是間接測(cè)度,最終目的是獲得能夠讓人明白的數(shù)據(jù),而表現(xiàn)數(shù)據(jù)的最主要形式就是統(tǒng)計(jì)指標(biāo),其他表現(xiàn)數(shù)據(jù)的形式都是派生出來(lái)的。所以,統(tǒng)計(jì)測(cè)度就是根據(jù)所設(shè)定的統(tǒng)計(jì)指標(biāo)去獲得所需的數(shù)據(jù)。關(guān)于第二個(gè)問(wèn)題,與后文所要論及的大數(shù)據(jù)有關(guān),就是定性測(cè)度問(wèn)題。在統(tǒng)計(jì)學(xué)中,數(shù)據(jù)可以分為兩類(lèi)———定性數(shù)據(jù)與定量數(shù)據(jù),其中定性數(shù)據(jù)又包括定類(lèi)數(shù)據(jù)與定序數(shù)據(jù)兩種,它們屬于非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)。相應(yīng)地,統(tǒng)計(jì)測(cè)度也可分為定性測(cè)度與定量測(cè)度。很顯然,只有定性測(cè)度與定量測(cè)度方法得到同步發(fā)展,統(tǒng)計(jì)學(xué)才能更加完善。總體上看,定量數(shù)據(jù)的統(tǒng)計(jì)測(cè)度已經(jīng)比較完善,但定性數(shù)據(jù)的統(tǒng)計(jì)測(cè)度還有很多問(wèn)題尚待解決,難點(diǎn)就在于測(cè)度的切入點(diǎn)———如何提取有效的信息、如何最終轉(zhuǎn)化為統(tǒng)計(jì)指標(biāo)。盡管關(guān)于定性數(shù)據(jù)分析的論著已經(jīng)不少,但還沒(méi)有從理論方法上建立起定性數(shù)據(jù)統(tǒng)計(jì)測(cè)度的體系,因此統(tǒng)計(jì)學(xué)在這方面的任務(wù)依然很重。

第三,從統(tǒng)計(jì)學(xué)的永恒主題看,通過(guò)科學(xué)的數(shù)據(jù)分析、得出有效的結(jié)論是其不變的追求,而數(shù)據(jù)分析過(guò)程就是綜合的統(tǒng)計(jì)測(cè)度過(guò)程。獲得數(shù)據(jù)的目的是為了發(fā)現(xiàn)隱含其中的有價(jià)值的信息,即發(fā)現(xiàn)數(shù)據(jù)背后的數(shù)據(jù),讓數(shù)據(jù)再生數(shù)據(jù),從而滿(mǎn)足人們認(rèn)識(shí)事物、掌握規(guī)律、科學(xué)決策的需要。除了總量、結(jié)構(gòu)等基本信息外,更重要的是通過(guò)數(shù)據(jù)分析來(lái)呈現(xiàn)現(xiàn)象的變化規(guī)律與相互關(guān)系。不難發(fā)現(xiàn),這種數(shù)據(jù)分析的過(guò)程,就是不斷進(jìn)行各種統(tǒng)計(jì)測(cè)度的過(guò)程,所以最終的統(tǒng)計(jì)分析結(jié)果實(shí)際上就是各環(huán)節(jié)、各方面的各種類(lèi)型的統(tǒng)計(jì)測(cè)度的疊加結(jié)果,或者說(shuō)是統(tǒng)計(jì)測(cè)度不斷放大的過(guò)程。大量針對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行分析研究的文獻(xiàn)(不論是否冠以“測(cè)度”兩字),只要有數(shù)據(jù)分析,都是如此。可以說(shuō),統(tǒng)計(jì)測(cè)度貫穿于統(tǒng)計(jì)數(shù)據(jù)分析的全過(guò)程。但是,為什么很多統(tǒng)計(jì)數(shù)據(jù)分析并沒(méi)有得出有效的結(jié)論呢?本文認(rèn)為原因就出在統(tǒng)計(jì)測(cè)度上,尤其是沒(méi)有首先解決好原始統(tǒng)計(jì)測(cè)度問(wèn)題。應(yīng)該說(shuō),圍繞數(shù)據(jù)分析已經(jīng)建立起一整套比較完整的統(tǒng)計(jì)方法體系,很多方法也都身經(jīng)百戰(zhàn)、行之有效,但一旦原始統(tǒng)計(jì)測(cè)度有問(wèn)題、數(shù)據(jù)不準(zhǔn)確或不真實(shí),那么任何方法都只是擺設(shè)。仔細(xì)研讀很多所謂的實(shí)證分析文獻(xiàn),其重點(diǎn)均在于構(gòu)建什么樣的模型或運(yùn)用什么樣的方法,雖然有的文獻(xiàn)也必須要討論選擇什么樣的變量(指標(biāo))這個(gè)問(wèn)題,但并不是系統(tǒng)地從測(cè)度的角度進(jìn)行闡述,因此所用的模型越來(lái)越復(fù)雜,但所得的結(jié)論卻離實(shí)際情況越來(lái)越遠(yuǎn)。學(xué)界總是有這樣一種觀念:變量越多、符號(hào)越新奇、模型越復(fù)雜的文章才越有水平,似乎這樣分析所得的結(jié)論才越可靠。殊不知,不以科學(xué)可靠的原始統(tǒng)計(jì)測(cè)度為基礎(chǔ),任何數(shù)據(jù)分析都會(huì)成為無(wú)源之水、無(wú)本之木,所得的結(jié)論也只是更精確的錯(cuò)誤而已。本文認(rèn)為,任何脫離科學(xué)統(tǒng)計(jì)測(cè)度的統(tǒng)計(jì)分析都是毫無(wú)意義的,充其量是一種數(shù)字游戲而已。應(yīng)該樹(shù)立這樣一種觀念:科學(xué)的統(tǒng)計(jì)數(shù)據(jù)分析首先取決于科學(xué)的統(tǒng)計(jì)測(cè)度,而不是首先取決于什么樣的分析模型,雖然模型也很重要。這也再一次證明,統(tǒng)計(jì)測(cè)度問(wèn)題是統(tǒng)計(jì)學(xué)的根本問(wèn)題。其實(shí),歸根結(jié)底看,在統(tǒng)計(jì)數(shù)據(jù)分析過(guò)程中,每一步分析都以前一步的測(cè)度為原始測(cè)度,每一步所用的方法都是統(tǒng)計(jì)測(cè)度方法,因此所有的統(tǒng)計(jì)分析方法都是統(tǒng)計(jì)測(cè)度方法。甚至可以說(shuō),統(tǒng)計(jì)學(xué)方法體系就是統(tǒng)計(jì)測(cè)度方法體系。

當(dāng)然,在實(shí)際的統(tǒng)計(jì)分析中,統(tǒng)計(jì)測(cè)度往往遇到一些困難,即有些指標(biāo)數(shù)據(jù)由于各種原因無(wú)法獲得,這就不得不采用替代這種途徑。例如,綠色GDP核算的概念已經(jīng)提出很多年,但為什么還沒(méi)有哪個(gè)國(guó)家真正公布綠色GDP數(shù)據(jù),原因就是自然資源價(jià)值、生態(tài)環(huán)境價(jià)值等的統(tǒng)計(jì)測(cè)度目前還面臨著很大的困難,其背后存在著一系列有待進(jìn)一步研究和解決的理論與實(shí)踐問(wèn)題,因此不少學(xué)者進(jìn)行了替代測(cè)度的探討。這一方面說(shuō)明統(tǒng)計(jì)測(cè)度的重要性,另一方面說(shuō)明統(tǒng)計(jì)測(cè)度替代的無(wú)奈性。但是,替代測(cè)度必須遵守相應(yīng)的規(guī)則與邏輯,要經(jīng)得起推敲。有的文獻(xiàn)明明知道有關(guān)變量無(wú)法測(cè)度、有關(guān)數(shù)據(jù)無(wú)法獲得,卻隨意地、不符合邏輯地進(jìn)行所謂的替代,結(jié)果是最后的結(jié)論不知替代成什么樣了,很難理解它的意義。關(guān)于替代測(cè)度的有效性問(wèn)題,邱東教授[7]已有精辟的論述,在此不再展開(kāi)討論。

三、統(tǒng)計(jì)測(cè)度是數(shù)據(jù)科學(xué)的基礎(chǔ)

籠統(tǒng)地講,數(shù)據(jù)科學(xué)就是以大數(shù)據(jù)為研究對(duì)象的科學(xué),需要多學(xué)科交叉融合、共同支撐。由于大數(shù)據(jù)是快速增長(zhǎng)的復(fù)雜數(shù)據(jù),因此大數(shù)據(jù)分析僅有統(tǒng)計(jì)思維與統(tǒng)計(jì)分析方法是不夠的,還需要強(qiáng)大的數(shù)據(jù)處理能力與計(jì)算能力。只有把統(tǒng)計(jì)思維、統(tǒng)計(jì)方法與計(jì)算技術(shù)結(jié)合起來(lái),才有可能真正挖掘出大數(shù)據(jù)中的有價(jià)值信息。本文認(rèn)為統(tǒng)計(jì)思維、統(tǒng)計(jì)方法與計(jì)算技術(shù)相結(jié)合的基礎(chǔ)就是科學(xué)的統(tǒng)計(jì)測(cè)度。

首先,大數(shù)據(jù)技術(shù)不能自行解決其計(jì)算和分析應(yīng)從何處著手的問(wèn)題。現(xiàn)代信息技術(shù)與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,使人類(lèi)進(jìn)入大數(shù)據(jù)時(shí)代,也有人說(shuō)進(jìn)入到數(shù)聯(lián)網(wǎng)時(shí)代,這意味著我們一方面被各種越來(lái)越多、越來(lái)越復(fù)雜的數(shù)據(jù)所包圍,另一方面又被數(shù)據(jù)中巨大的信息價(jià)值所吸引,想從中挖掘出可供決策之用的信息。如何挖掘大數(shù)據(jù)?人們已經(jīng)進(jìn)行了艱苦的探索,發(fā)展了很多專(zhuān)門(mén)的方法技術(shù),并已嘗到了不少甜頭,但遠(yuǎn)未達(dá)到充分利用大數(shù)據(jù)中有效信息的目的,因?yàn)橐延械拇髷?shù)據(jù)分析研究主要集中于計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程、計(jì)算數(shù)學(xué)等領(lǐng)域,重點(diǎn)是計(jì)算能力與算法研究,而很少?gòu)慕y(tǒng)計(jì)學(xué)的角度進(jìn)行有針對(duì)的探討,還沒(méi)有真正進(jìn)入數(shù)據(jù)分析的深層。這里面實(shí)際上忽略了最基礎(chǔ)的統(tǒng)計(jì)測(cè)度問(wèn)題。如果說(shuō),計(jì)算技術(shù)的發(fā)展能夠解決數(shù)據(jù)儲(chǔ)存與計(jì)算的能力問(wèn)題,算法模型的改進(jìn)能夠解決大數(shù)據(jù)分析的綜合能力問(wèn)題,那么它們?nèi)匀徊荒芙鉀Q對(duì)誰(shuí)進(jìn)行計(jì)算與分析的問(wèn)題,也即從何處著手的問(wèn)題。無(wú)論是傳統(tǒng)的結(jié)構(gòu)型數(shù)據(jù),還是現(xiàn)在的包含大量非結(jié)構(gòu)型數(shù)據(jù)的大數(shù)據(jù),要對(duì)它們進(jìn)行分析都必須找到正確的切入口,即分析的基本元素是什么,或者說(shuō)需要測(cè)度什么。當(dāng)然,還有如何測(cè)度的問(wèn)題。然后,才能進(jìn)行分組、綜合和構(gòu)建模型,否則大數(shù)據(jù)分析不會(huì)達(dá)到人們的預(yù)期。

其次,大數(shù)據(jù)之所以催生數(shù)據(jù)科學(xué),就是為了通過(guò)多學(xué)科交叉融合來(lái)共同解決大數(shù)據(jù)分析中存在的問(wèn)題,其中包括統(tǒng)計(jì)測(cè)度問(wèn)題,這一點(diǎn)對(duì)于非結(jié)構(gòu)化數(shù)據(jù)尤為突出。實(shí)際上,大數(shù)據(jù)的本質(zhì)就是非結(jié)構(gòu)化數(shù)據(jù),一是體量大、比重高(超過(guò)95%),二是變化快、形式多,三是內(nèi)容雜、不確定。通過(guò)各種社交網(wǎng)絡(luò)、自媒體、富媒體,以及人機(jī)對(duì)話(huà)和機(jī)器感應(yīng)記錄等產(chǎn)生的各種非結(jié)構(gòu)化數(shù)據(jù),例如各種文字、各種表情符號(hào)、各種聲音、各種圖像,到底表示什么?綜合在一起能體現(xiàn)什么規(guī)律?如何綜合各種信息?存在著大量有待研究的問(wèn)題。其實(shí),文字的長(zhǎng)短、用詞、表達(dá)形式(敘述式、議論式、散文式、詩(shī)歌式,等)甚至字體大小與顏色,表情類(lèi)型與偏好,聲音高低、頻率與情緒,圖像顏色等等,都是有特定意義的,即在特定環(huán)境條件下的反應(yīng)。所以,一句話(huà)或一段聲音的意義并非文字本身的意思,一個(gè)表情符號(hào)的意義并非符號(hào)表征的意思,一個(gè)圖像的意義并非圖像內(nèi)容與色彩本身的意思,因?yàn)楸澈笥刑嗟奈粗H藗優(yōu)g覽檢索各種信息的習(xí)慣、收看與回復(fù)郵件等信息的習(xí)慣、參與信息網(wǎng)絡(luò)的習(xí)慣、購(gòu)物習(xí)慣與支付習(xí)慣等等,也是如此。更何況,同樣的網(wǎng)絡(luò)詞匯在不同的時(shí)間代表著不同的語(yǔ)義。這背后隱藏著的是人們的行為與社會(huì)關(guān)系,既具有個(gè)性又具有共性,極其復(fù)雜。所以對(duì)這樣的數(shù)據(jù)進(jìn)行分析,首先絕非是計(jì)算問(wèn)題,也不是用什么模型問(wèn)題,而首先是從何處著手、如何選取關(guān)鍵詞、如何選定關(guān)聯(lián)詞、可以用什么樣的指標(biāo)來(lái)綜合、可以用什么樣的表式來(lái)表現(xiàn)等問(wèn)題,一句話(huà)就是統(tǒng)計(jì)測(cè)度問(wèn)題。非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)計(jì)測(cè)度將主要是定義測(cè)度,這些問(wèn)題不解決,分析模型也是難以構(gòu)建的,或者難以得出令人信服的結(jié)論。

例如,關(guān)于《紅樓夢(mèng)》前80回與后40回是否同一作者的爭(zhēng)論,韋博成[10]進(jìn)行了綜合性的比較研究并提出了自己的觀點(diǎn),他指出已有美國(guó)威斯康辛大學(xué)華裔學(xué)者陳炳藻教授(1980)[11]、我國(guó)華東師范大學(xué)陳大康教授(1987年)[12]和復(fù)旦大學(xué)李賢平教授(1987年)[13]等學(xué)者從統(tǒng)計(jì)學(xué)的角度進(jìn)行過(guò)專(zhuān)門(mén)的研究,但卻得出了不同的結(jié)論:陳炳藻教授認(rèn)為前80回與后40回均是曹雪芹所著;陳大康教授認(rèn)為前80回與后40回為不同人所著;李賢平教授認(rèn)為前80回是曹雪芹根據(jù)《石頭記》增刪而成,后40回是曹雪芹親友搜集整理原稿加工補(bǔ)寫(xiě)而成。此外,還有其他一些學(xué)者進(jìn)行過(guò)類(lèi)似的研究,也有一些不同的結(jié)論。為什么都通過(guò)提取關(guān)聯(lián)詞和統(tǒng)計(jì)的方法卻得出不同的結(jié)論?原因就在于用以分析的關(guān)聯(lián)詞不同,即統(tǒng)計(jì)測(cè)度的切入點(diǎn)不同,當(dāng)然也有統(tǒng)計(jì)方法上的差異,但前者是根本。至少存在幾個(gè)統(tǒng)計(jì)測(cè)度上的問(wèn)題:提取單一維度的關(guān)聯(lián)詞還是多維度的關(guān)聯(lián)詞?提取什么類(lèi)型的關(guān)聯(lián)詞(例如:關(guān)聯(lián)詞是名詞、形容詞還是動(dòng)詞;是花卉、樹(shù)木、飲食、醫(yī)藥還是詩(shī)詞)?這些關(guān)聯(lián)詞可以綜合為什么樣的指標(biāo)?等等。由此可見(jiàn),原始統(tǒng)計(jì)測(cè)度代表著數(shù)據(jù)分析的方向。

相比《紅樓夢(mèng)》,大數(shù)據(jù)分析要復(fù)雜得多、困難得多。所以,數(shù)據(jù)科學(xué)除了需要數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)、人工智能等學(xué)科的交叉融合外,還需要與行為科學(xué)、語(yǔ)言學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)等學(xué)科相結(jié)合,以便能很好地解決作為數(shù)據(jù)分析之前提的統(tǒng)計(jì)測(cè)度問(wèn)題。

第三,數(shù)據(jù)科學(xué)將進(jìn)一步拓展統(tǒng)計(jì)測(cè)度的邊界,并提出更高的要求。伴隨著人類(lèi)認(rèn)識(shí)世界的范圍的不斷拓展,統(tǒng)計(jì)測(cè)度的范圍也不斷擴(kuò)大,從自然現(xiàn)象統(tǒng)計(jì)測(cè)度到人口現(xiàn)象、經(jīng)濟(jì)現(xiàn)象統(tǒng)計(jì)測(cè)度,再到社會(huì)現(xiàn)象、環(huán)境現(xiàn)象、政治現(xiàn)象等統(tǒng)計(jì)測(cè)度,幾乎已經(jīng)滲透到了所有可以想象到的領(lǐng)域。相應(yīng)地,統(tǒng)計(jì)數(shù)據(jù)分析也從少量數(shù)據(jù)的分析進(jìn)入到了大數(shù)據(jù)分析。大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性(王元卓等,2013)[14],意味著統(tǒng)計(jì)測(cè)度的內(nèi)容大大增加,原來(lái)一些不能測(cè)度的數(shù)據(jù)被納入到了統(tǒng)計(jì)測(cè)度的范圍,按照邱東教授的說(shuō)法就是統(tǒng)計(jì)測(cè)度的邊界大大擴(kuò)展了。統(tǒng)計(jì)測(cè)度邊界的擴(kuò)大,必須以統(tǒng)計(jì)測(cè)度能力的提升為前提,即要求統(tǒng)計(jì)學(xué)借助現(xiàn)代信息技術(shù)進(jìn)一步提升處理和分析數(shù)據(jù)的能力———對(duì)大數(shù)據(jù)“化繁為簡(jiǎn)”、“變厚為薄”的能力,這就必須以科學(xué)準(zhǔn)確的大數(shù)據(jù)統(tǒng)計(jì)測(cè)度為前提,既改變統(tǒng)計(jì)思維,又創(chuàng)新統(tǒng)計(jì)分析方法,其中就包括統(tǒng)計(jì)測(cè)度思維、統(tǒng)計(jì)測(cè)度方法與統(tǒng)計(jì)測(cè)度標(biāo)準(zhǔn)。面對(duì)大量繁雜的數(shù)據(jù),如果沒(méi)有更好的統(tǒng)計(jì)測(cè)度思路與方法,包括個(gè)體標(biāo)志定義方法、最小數(shù)據(jù)細(xì)胞分組與聚類(lèi)方法、關(guān)聯(lián)詞含義的時(shí)間影響計(jì)量方法、定性測(cè)度指標(biāo)篩選方法、再測(cè)度路徑與方法、大數(shù)據(jù)統(tǒng)計(jì)測(cè)度評(píng)價(jià)標(biāo)準(zhǔn)等,那么統(tǒng)計(jì)學(xué)在數(shù)據(jù)科學(xué)發(fā)展過(guò)程中就難以發(fā)揮應(yīng)有的作用,數(shù)據(jù)科學(xué)也將裹足不前。這就是統(tǒng)計(jì)學(xué)邁向數(shù)據(jù)科學(xué)的重要挑戰(zhàn)之一。

綜上所述,統(tǒng)計(jì)測(cè)度的基礎(chǔ)性問(wèn)題從統(tǒng)計(jì)學(xué)延伸到了數(shù)據(jù)科學(xué),是兩者的共同基礎(chǔ),并且對(duì)于數(shù)據(jù)科學(xué)而言顯得更為重要。大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性導(dǎo)致了統(tǒng)計(jì)測(cè)度的難度猛增,亟需建立面向大數(shù)據(jù)分析的統(tǒng)計(jì)測(cè)度理論與方法。要通過(guò)研究大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性特征的基本因素,以及這些因素之間的內(nèi)在聯(lián)系、外在指標(biāo)和測(cè)度方法,進(jìn)而研究基于先進(jìn)計(jì)算技術(shù)的大數(shù)據(jù)度量模型,構(gòu)建尋找面向計(jì)算的數(shù)據(jù)內(nèi)核或者數(shù)據(jù)邊界的基本方法。總之,建立有效易行的數(shù)據(jù)表示方法,即科學(xué)的統(tǒng)計(jì)測(cè)度方法,是數(shù)據(jù)科學(xué)必須解決的基礎(chǔ)問(wèn)題之一。

四、創(chuàng)新與完善大數(shù)據(jù)統(tǒng)計(jì)測(cè)度方法

如前所述,統(tǒng)計(jì)學(xué)研究對(duì)象已經(jīng)從結(jié)構(gòu)化數(shù)據(jù)延伸到了包括非結(jié)構(gòu)化數(shù)據(jù)在內(nèi)的一切數(shù)據(jù),統(tǒng)計(jì)測(cè)度邊界得到了大大的擴(kuò)展。按照邱東教授[7]曾經(jīng)引用過(guò)的海德格爾的話(huà):“界限并不表示某一事物的發(fā)展到此為止,而是像希臘人所認(rèn)知的那樣,界限是某種事物開(kāi)始展現(xiàn)的地方”,預(yù)示著統(tǒng)計(jì)學(xué)在數(shù)據(jù)科學(xué)發(fā)展階段的新起點(diǎn)已經(jīng)展現(xiàn)在我們面前。新的統(tǒng)計(jì)測(cè)度邊界催生統(tǒng)計(jì)測(cè)度方法的創(chuàng)新,統(tǒng)計(jì)測(cè)度方法的創(chuàng)新促進(jìn)統(tǒng)計(jì)測(cè)度邊界的拓展,兩者相輔相成,共同推動(dòng)統(tǒng)計(jì)學(xué)與數(shù)據(jù)科學(xué)的發(fā)展。為此,我們要系統(tǒng)梳理統(tǒng)計(jì)測(cè)度方法的發(fā)展歷程,面對(duì)大數(shù)據(jù)提出的新挑戰(zhàn),大膽探索統(tǒng)計(jì)測(cè)度的新思路、新理論和新方法,為數(shù)據(jù)科學(xué)奠定堅(jiān)實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ)。為此提出如下幾點(diǎn)建議:

首先,要緊密結(jié)合現(xiàn)象的本質(zhì)去探求更科學(xué)的統(tǒng)計(jì)測(cè)度方法。本質(zhì)決定一切,既然統(tǒng)計(jì)測(cè)度的目的是獲得客觀反映現(xiàn)象本質(zhì)的數(shù)據(jù),那么深入到現(xiàn)象本質(zhì)、認(rèn)識(shí)和掌握現(xiàn)象的本質(zhì),是科學(xué)統(tǒng)計(jì)測(cè)度的關(guān)鍵,也是探求新的統(tǒng)計(jì)方法的出發(fā)點(diǎn)。換句話(huà)說(shuō),科學(xué)的統(tǒng)計(jì)測(cè)度方法能夠體現(xiàn)出數(shù)據(jù)的真正意義。例如,要探求社交網(wǎng)絡(luò)數(shù)據(jù)的統(tǒng)計(jì)分析和測(cè)度方法,就必須了解社交網(wǎng)絡(luò)的產(chǎn)生背景、構(gòu)成要素、表現(xiàn)形式與基本特征,既要研究它的共性問(wèn)題,又要研究它的個(gè)性問(wèn)題與差異性,同時(shí)還要研究它的變化趨勢(shì)。只有這樣,才能掌握社交網(wǎng)絡(luò)數(shù)據(jù)的構(gòu)成要件或元素,才能建立起科學(xué)的、能有效體現(xiàn)社交網(wǎng)絡(luò)數(shù)據(jù)意義的統(tǒng)計(jì)測(cè)度方法。再如,要分析研究電子商務(wù)數(shù)據(jù),也必須先弄清楚什么是電子商務(wù),尤其是弄清楚它與傳統(tǒng)的商業(yè)模式有什么不同(包括物流、資金流與信息流)、有哪些新生事物(包括時(shí)空特征、法律監(jiān)管)等等,否則統(tǒng)計(jì)測(cè)度無(wú)從下手或者抓不住要害。同時(shí),作為一個(gè)新的研究領(lǐng)域,數(shù)據(jù)科學(xué)的理論基礎(chǔ)將與計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、人工智能、數(shù)學(xué)、社會(huì)科學(xué)等有關(guān),離不開(kāi)對(duì)相關(guān)學(xué)科領(lǐng)域知識(shí)與研究方法的借鑒,因此對(duì)相關(guān)領(lǐng)域的知識(shí)與研究方法的學(xué)習(xí)十分重要。否則,就會(huì)嚴(yán)重扭曲統(tǒng)計(jì)測(cè)度方法,胡亂設(shè)置測(cè)度標(biāo)志,這需要引起高度關(guān)注。

其次,要緊密結(jié)合大數(shù)據(jù)的特點(diǎn)去創(chuàng)新統(tǒng)計(jì)測(cè)度方法。大數(shù)據(jù)的特點(diǎn)是復(fù)雜性、不確定性和涌現(xiàn)性并存,構(gòu)成了多維的數(shù)據(jù)空間,里面蘊(yùn)藏著豐富的信息資源,這是傳統(tǒng)的統(tǒng)計(jì)數(shù)據(jù)不可比擬的。那么該從何處進(jìn)入這樣的數(shù)據(jù)空間?怎么進(jìn)去?又怎么出來(lái)?這歸根結(jié)底還是統(tǒng)計(jì)測(cè)度方法問(wèn)題。因此,在開(kāi)展大數(shù)據(jù)分析之前,首先要研究大數(shù)據(jù)的基礎(chǔ)性問(wèn)題,包括大數(shù)據(jù)的內(nèi)在機(jī)理(包括大數(shù)據(jù)的演化與傳播機(jī)制、生命周期),數(shù)據(jù)科學(xué)與社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、行為科學(xué)等之間的互動(dòng)機(jī)制,以及大數(shù)據(jù)的結(jié)構(gòu)與效能的規(guī)律性等等,為創(chuàng)新統(tǒng)計(jì)測(cè)度方法提供導(dǎo)向。本文認(rèn)為,再?gòu)?fù)雜的數(shù)據(jù)也有共性,再不確定的數(shù)據(jù)也有規(guī)律,再涌現(xiàn)的數(shù)據(jù)也有軌跡。網(wǎng)絡(luò)大數(shù)據(jù)背后的網(wǎng)絡(luò)平均路徑長(zhǎng)度、度分布、聚集系數(shù)、核數(shù)、介數(shù)等具有共性的特征與參數(shù),是開(kāi)展復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)分析的基礎(chǔ)(李國(guó)杰、程學(xué)旗,2012)[15];大數(shù)據(jù)在時(shí)空維度上的分布形式、內(nèi)在結(jié)構(gòu)、動(dòng)態(tài)變化和相關(guān)聯(lián)的規(guī)律,是找到大數(shù)據(jù)分析切入口、進(jìn)而簡(jiǎn)化大數(shù)據(jù)表征的前提;大數(shù)據(jù)的涌現(xiàn)性軌跡(包括模式涌現(xiàn)性、行為涌現(xiàn)性和智慧涌現(xiàn)性),是研究更多的社會(huì)網(wǎng)絡(luò)模型和理解網(wǎng)絡(luò)瓦解失效原因,理解人們網(wǎng)絡(luò)行為涌現(xiàn)特征(例如人們發(fā)郵件數(shù)量的時(shí)間分布特征),以及探求大量自發(fā)個(gè)體語(yǔ)義融合連接形成有特定意義的通用語(yǔ)義之過(guò)程的路徑(靳小龍等,2013)[16]。也就是說(shuō),這些共性、規(guī)律和軌跡就是統(tǒng)計(jì)測(cè)度的主要依據(jù),也是重點(diǎn)內(nèi)容。發(fā)展和創(chuàng)新能夠準(zhǔn)確發(fā)現(xiàn)大數(shù)據(jù)的共性、規(guī)律和軌跡的定量方法,其實(shí)就是發(fā)展和創(chuàng)新大數(shù)據(jù)統(tǒng)計(jì)測(cè)度方法。

第三,要緊密結(jié)合現(xiàn)代信息技術(shù)以完善統(tǒng)計(jì)測(cè)度方法。復(fù)雜、多變和不斷涌現(xiàn)的大數(shù)據(jù),不僅需要借助現(xiàn)代信息技術(shù)(包括硬件與軟件)來(lái)解決極其復(fù)雜的分析計(jì)算問(wèn)題,也需要利用現(xiàn)代信息技術(shù)來(lái)解決其繁雜多樣的統(tǒng)計(jì)測(cè)度問(wèn)題。對(duì)于大數(shù)據(jù),不論是原始統(tǒng)計(jì)測(cè)度還是再測(cè)度,其復(fù)雜性或難度都不是傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)所能相提并論的,哪怕是基本的關(guān)聯(lián)詞計(jì)數(shù)、分類(lèi)與匯總,其工作量之大也超乎想象,不借用現(xiàn)代信息技術(shù)幾乎是不可能完成的。而事實(shí)上,有些統(tǒng)計(jì)測(cè)度的內(nèi)容與方法本身也是以數(shù)據(jù)處理能力的提升為前提的。可以說(shuō),脫離現(xiàn)代信息技術(shù),人們難以承受大數(shù)據(jù)的統(tǒng)計(jì)測(cè)度與分析任務(wù);要把統(tǒng)計(jì)測(cè)度思想變?yōu)榭蓪?shí)現(xiàn)的統(tǒng)計(jì)測(cè)度方法,必須借助現(xiàn)代信息技術(shù)。為此,要充分利用各種信息技術(shù)和手段,把統(tǒng)計(jì)測(cè)度與數(shù)據(jù)清洗相結(jié)合、與數(shù)據(jù)分析模型相結(jié)合、與計(jì)算方法相結(jié)合,努力建立融自動(dòng)搜索統(tǒng)計(jì)測(cè)度、動(dòng)態(tài)演化統(tǒng)計(jì)測(cè)度和自主優(yōu)選統(tǒng)計(jì)測(cè)度為一體的大數(shù)據(jù)統(tǒng)計(jì)測(cè)度方法體系。

第9篇

【關(guān)鍵詞】統(tǒng)計(jì)學(xué);統(tǒng)計(jì)思想;認(rèn)識(shí)

1關(guān)于統(tǒng)計(jì)學(xué)

統(tǒng)計(jì)學(xué)是一門(mén)實(shí)質(zhì)性的社會(huì)科學(xué),既研究社會(huì)生活的客觀規(guī)律,也研究統(tǒng)計(jì)方法。統(tǒng)計(jì)學(xué)是繼承和發(fā)展基礎(chǔ)統(tǒng)計(jì)的理論成果,堅(jiān)持統(tǒng)計(jì)學(xué)的社會(huì)科學(xué)性質(zhì),使統(tǒng)計(jì)理論研究更接近統(tǒng)計(jì)工作實(shí)際,在國(guó)家和社會(huì)得到廣泛發(fā)展。

2 統(tǒng)計(jì)學(xué)中的幾種統(tǒng)計(jì)思想

2.1 統(tǒng)計(jì)思想的形成

統(tǒng)計(jì)思想不是天然形成的,需要經(jīng)歷統(tǒng)計(jì)觀念、統(tǒng)計(jì)意識(shí)、統(tǒng)計(jì)理念等階段。統(tǒng)計(jì)思想是根據(jù)人類(lèi)社會(huì)需求的變化而開(kāi)展各種統(tǒng)計(jì)實(shí)踐、統(tǒng)計(jì)理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計(jì)思想。

2.2 比較常用的幾種統(tǒng)計(jì)思想

所謂統(tǒng)計(jì)思想,就是統(tǒng)計(jì)實(shí)際工作、統(tǒng)計(jì)學(xué)理論及應(yīng)用研究中必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計(jì)思想主要包括:均值思想、變異思想、估計(jì)思想、相關(guān)思想、擬合思想、檢驗(yàn)思想。現(xiàn)分述如下:

2.2.1 均值思想

均值是對(duì)所要研究對(duì)象的簡(jiǎn)明而重要的代表。均值概念幾乎涉及所有統(tǒng)計(jì)學(xué)理論,是統(tǒng)計(jì)學(xué)的基本思想。均值思想也要求從總體上看問(wèn)題,但要求觀察其一般發(fā)展趨勢(shì),避免個(gè)別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。

2.2.2 變異思想

統(tǒng)計(jì)研究同類(lèi)現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計(jì)方法就是要認(rèn)識(shí)事物數(shù)量方面的差異。統(tǒng)計(jì)學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對(duì)同類(lèi)事物特征的抽象和宏觀度量。

2.2.3 估計(jì)思想

估計(jì)以樣本推測(cè)總體,是對(duì)同類(lèi)事物的由此及彼式的認(rèn)識(shí)方法。使用估計(jì)方法有一個(gè)預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計(jì)理論對(duì)置信程度的測(cè)量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。

2.2.4 相關(guān)思想

事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個(gè)別事務(wù)所組成,這些個(gè)別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個(gè)體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。

2.2.5 擬合思想

擬合是對(duì)不同類(lèi)型事物之間關(guān)系之表象的抽象。任何一個(gè)單一的關(guān)系必須依賴(lài)其他關(guān)系而存在,所有實(shí)際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對(duì)規(guī)律或趨勢(shì)的擬合。擬合的成果是模型,反映一般趨勢(shì)。趨勢(shì)表達(dá)的是“事物和關(guān)系的變化過(guò)程在數(shù)量上所體現(xiàn)的模式和基于此而預(yù)示的可能性”。

2.2.6 檢驗(yàn)思想

統(tǒng)計(jì)方法總是歸納性的,其結(jié)論永遠(yuǎn)帶有一定的或然性,基于局部特征和規(guī)律所推廣出來(lái)的判斷不可能完全可信,檢驗(yàn)過(guò)程就是利用樣本的實(shí)際資料來(lái)檢驗(yàn)事先對(duì)總體某些數(shù)量特征的假設(shè)是否可信。

2.3 統(tǒng)計(jì)思想的特點(diǎn)

作為一門(mén)應(yīng)用統(tǒng)計(jì)學(xué),它從數(shù)理統(tǒng)計(jì)學(xué)派汲取新的營(yíng)養(yǎng),并且越來(lái)越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來(lái)越密切,但在統(tǒng)計(jì)思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點(diǎn)能從以下四個(gè)方面體現(xiàn)出:(1)統(tǒng)計(jì)思想強(qiáng)調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)統(tǒng)計(jì)思想強(qiáng)調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)統(tǒng)計(jì)思想強(qiáng)調(diào)客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計(jì)思想強(qiáng)調(diào)定性分析與定量分析的統(tǒng)一。

3 對(duì)統(tǒng)計(jì)思想的一些思考

3.1 要更正當(dāng)前存在的一些不正確的思想認(rèn)識(shí)

英國(guó)著名生物學(xué)家、統(tǒng)計(jì)學(xué)家高爾頓曾經(jīng)說(shuō)過(guò):“統(tǒng)計(jì)學(xué)具有處理復(fù)雜問(wèn)題的非凡能力,當(dāng)科學(xué)的探索者在前進(jìn)的過(guò)程中荊棘載途時(shí),唯有統(tǒng)計(jì)學(xué)可以幫助他們打開(kāi)一條通道”。但事實(shí)并非這么簡(jiǎn)單,因?yàn)槲覀兯媾R的現(xiàn)實(shí)問(wèn)題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜越科學(xué),在實(shí)際的分析研究中,喜歡簡(jiǎn)單問(wèn)題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實(shí),真正的科學(xué)是使復(fù)雜的問(wèn)題簡(jiǎn)單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計(jì)才是科學(xué),描述統(tǒng)計(jì)不是科學(xué),并延伸擴(kuò)大到只有數(shù)理統(tǒng)計(jì)是科學(xué)、社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)不是科學(xué)這樣的認(rèn)識(shí)。這種認(rèn)識(shí)是極其錯(cuò)誤的,至少是對(duì)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的無(wú)知。比利時(shí)數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計(jì)學(xué)應(yīng)用于人類(lèi)事物,試圖把統(tǒng)計(jì)學(xué)創(chuàng)建成改良社會(huì)的一種工具。經(jīng)濟(jì)學(xué)和人口統(tǒng)計(jì)學(xué)中的某些近代概念,如gnp、人口增長(zhǎng)率等等,均是凱特勒及其弟子們的遺產(chǎn)。

3.2要不斷拓展統(tǒng)計(jì)思維方式

統(tǒng)計(jì)學(xué)是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測(cè)到的數(shù)據(jù)信息(尤其是不完全甚至劣質(zhì)的信息)去產(chǎn)生新的知識(shí)或去驗(yàn)證一個(gè)假設(shè),即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結(jié)論。歸納推理是要在數(shù)據(jù)信息的基礎(chǔ)上透過(guò)偶然性去發(fā)現(xiàn)必然性。演繹推理是對(duì)統(tǒng)計(jì)認(rèn)識(shí)能力的深化,尤其是在根據(jù)必然性去研究和認(rèn)識(shí)偶然性方面,具有很大的作用。

3.3深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí)

任何統(tǒng)計(jì)研究都離不開(kāi)數(shù)據(jù)分析。因?yàn)檫@是得到統(tǒng)計(jì)研究結(jié)論的必要環(huán)節(jié)。雖然統(tǒng)計(jì)分析的形式隨時(shí)代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計(jì)分析的目的卻一直沒(méi)有改變。對(duì)統(tǒng)計(jì)數(shù)據(jù)分析的原因有以下三個(gè)方面:一是基于同樣的數(shù)據(jù)會(huì)得出不同、甚至相反的分析結(jié)論;二是我們所面對(duì)的分析數(shù)據(jù)有時(shí)是缺損的或存在不真實(shí)性;三是我們所面對(duì)的分析數(shù)據(jù)有時(shí)則又是海量的,讓人無(wú)從下手。雖然統(tǒng)計(jì)數(shù)據(jù)分析已經(jīng)經(jīng)歷了描述性數(shù)據(jù)分析(dda)、推斷性數(shù)據(jù)分析(ida)和探索性數(shù)據(jù)分析(eda)等階段,分析的方法技術(shù)已經(jīng)有了質(zhì)的飛躍,但與人類(lèi)不斷提高的要求相比,存在的問(wèn)題似乎也越來(lái)越多。所以,我們必須深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí),圍繞“準(zhǔn)確解答特定問(wèn)題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開(kāi)展數(shù)據(jù)分析方法技術(shù)的研究。

參考文獻(xiàn):

[1] 陳福貴.統(tǒng)計(jì)思想雛議[j]北京統(tǒng)計(jì), 2004,(05) .

[2] 龐有貴.統(tǒng)計(jì)工作及統(tǒng)計(jì)思想[j]科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì), 2004,(03) .

相關(guān)文章
相關(guān)期刊
主站蜘蛛池模板: 亚洲国产成人在线 | 可以看的视频 | 国产区精品视频 | 伊人色在线观看 | 污污网站在线 | 99热视屏| 国产精品99精品久久免费 | 色中色综合 | 亚洲 欧美 中文 日韩专区 | 中文字幕天天躁夜夜狠狠综合 | 日韩福利视频高清免费看 | 久久国产精品二国产精品 | 精品一区二区三区三区 | 97中文字幕在线观看 | 99re综合 | 精品一区二区三区四区五区六区 | 激情综合站 | 男女男免费视频网站国产 | 暖暖免费观看视频 | 国产最新自拍 | 91av亚洲| 黄网站色视频免费观看w | 伊人久色| 国产在线精品成人一区二区三区 | 成人做羞羞事免费网站 | 国产亚洲精品2021自在线 | 狠狠操天天操夜夜操 | 国产亚洲精品中文带字幕21页 | 色久天 | 精品国产亚洲人成在线 | 五月综合激情视频在线观看 | 99热国产免费 | 在线99视频 | 婷婷在线免费观看 | 涩涩涩丁香色婷五月网视色 | 欧美高清视频性播放 | 欧美精品一区二区三区免费 | 你懂的在线视频 | 欧美日韩在线高清 | 国产精品久久久久久久久久一区 | 精品综合一区二区三区 |