時(shí)間:2023-08-20 14:46:43
導(dǎo)言:作為寫(xiě)作愛(ài)好者,不可錯(cuò)過(guò)為您精心挑選的10篇數(shù)據(jù)分析的方法,它們將為您的寫(xiě)作提供全新的視角,我們衷心期待您的閱讀,并希望這些內(nèi)容能為您提供靈感和參考。
中圖分類(lèi)號(hào):N37 文獻(xiàn)標(biāo)識(shí)碼:B 文章編號(hào):1009-9166(2009)02(c)-0063-02
現(xiàn)代企業(yè)的決策往往是在整合大量信息資料的基礎(chǔ)上制定出來(lái)的,對(duì)數(shù)據(jù)的理解和應(yīng)用將是企業(yè)決策的基石。與傳統(tǒng)的操作型應(yīng)用相比,數(shù)據(jù)利用的應(yīng)用建設(shè)難度更大,它是隨著管理水平而發(fā)展,同時(shí)又取決于業(yè)務(wù)人員的主觀意識(shí),這就決定了以數(shù)據(jù)利用為核心的應(yīng)用建設(shè)不可能一蹴而就,而是一個(gè)長(zhǎng)期迭展的建設(shè)過(guò)程。從2003年起工廠開(kāi)始全面推進(jìn)數(shù)據(jù)分析應(yīng)用工作,經(jīng)歷過(guò)曲折,同時(shí)也有收獲。經(jīng)過(guò)多年的努力,工廠的數(shù)據(jù)分析應(yīng)用工作開(kāi)始進(jìn)入良性發(fā)展階段,筆者認(rèn)為有必要對(duì)工廠目前數(shù)據(jù)分析應(yīng)用工作作一總結(jié)和思考。
一、工廠數(shù)據(jù)分析應(yīng)用工作開(kāi)展現(xiàn)狀
工廠數(shù)據(jù)分析應(yīng)用工作推進(jìn)至今已有四五年的時(shí)間,從最初全面調(diào)研工廠數(shù)據(jù)量和數(shù)據(jù)分析應(yīng)用狀況,將數(shù)據(jù)分析應(yīng)用率指標(biāo)作為方針目標(biāo)定量指標(biāo)來(lái)考核,到后來(lái)將數(shù)據(jù)分析應(yīng)用工作的推進(jìn)重心從量向質(zhì)轉(zhuǎn)移,采用以項(xiàng)目為載體進(jìn)行管理,著重體現(xiàn)數(shù)據(jù)分析應(yīng)用的實(shí)效性,再到目前以分析應(yīng)用的需求為導(dǎo)向,以分析應(yīng)用點(diǎn)為載體,分層次進(jìn)行策劃。經(jīng)過(guò)上述三個(gè)階段,工廠數(shù)據(jù)分析應(yīng)用工作推進(jìn)機(jī)制得到了逐步的完善,形成了廣度深度協(xié)同發(fā)展的信息資源利用管理框架。截止到目前,工廠數(shù)據(jù)分析應(yīng)用率達(dá)到96%,四個(gè)層次的分析應(yīng)用點(diǎn)共計(jì)100多個(gè),數(shù)據(jù)分析應(yīng)用工作在生產(chǎn)、質(zhì)量、成本、物耗、能源等條線得到廣泛開(kāi)展,有效推動(dòng)了工廠管理數(shù)字化和精細(xì)化。2007年,工廠開(kāi)始探索細(xì)化四個(gè)應(yīng)用層次的推進(jìn)脈絡(luò),進(jìn)一步豐富工廠信息資源利用框架,形成層次清晰、脈絡(luò)鮮明、職責(zé)分明的信息資源利用立體化的推進(jìn)思路。
1、第一層次現(xiàn)場(chǎng)監(jiān)控層。第一層次現(xiàn)場(chǎng)監(jiān)控層,應(yīng)用主體是一線工人和三班管理干部,應(yīng)用對(duì)象是生產(chǎn)過(guò)程實(shí)時(shí)數(shù)據(jù),應(yīng)用目標(biāo)是通過(guò)加強(qiáng)生產(chǎn)過(guò)程控制,輔助一線及時(shí)發(fā)現(xiàn)生產(chǎn)過(guò)程中的異常情況,提高生產(chǎn)穩(wěn)定性。例如制絲車(chē)間摻配工段的生產(chǎn)報(bào)警,通過(guò)對(duì)生產(chǎn)過(guò)程中葉絲配比、膨絲配比、梗絲配比、薄片配比、加香配比等信息進(jìn)行判異操作,對(duì)異常情況通過(guò)語(yǔ)音報(bào)警方式提醒擋車(chē)工進(jìn)行異常處理;例如卷包車(chē)間通過(guò)在機(jī)臺(tái)電腦上對(duì)各生產(chǎn)機(jī)組的工藝、設(shè)備參數(shù)、實(shí)時(shí)產(chǎn)量、質(zhì)量、損耗數(shù)據(jù)的監(jiān)控,提高對(duì)產(chǎn)品質(zhì)量的過(guò)程控制能力。第一層次應(yīng)用以上位機(jī)和機(jī)臺(tái)電腦上固化的監(jiān)控模型為主,制絲車(chē)間每個(gè)工序、卷包車(chē)間每種機(jī)型的應(yīng)用點(diǎn)都有所不同,為此我們建立了制絲車(chē)間以工序?yàn)槊}絡(luò),卷包車(chē)間以機(jī)種為脈絡(luò)的應(yīng)用點(diǎn)列表,圍繞脈絡(luò)對(duì)第一層次應(yīng)用點(diǎn)進(jìn)行梳理,形成第一層次應(yīng)用的規(guī)范化模板。制絲車(chē)間第一層次應(yīng)用點(diǎn)模板包括工序名稱(chēng)、應(yīng)用點(diǎn)名稱(chēng)、應(yīng)用模型描述、應(yīng)用對(duì)象、應(yīng)用平臺(tái)、異常處置路徑等基本要素。卷包車(chē)間應(yīng)用點(diǎn)模板橫向根據(jù)機(jī)種分,縱向按上班及交接班、上班生產(chǎn)過(guò)程中、下班及交接班三個(gè)時(shí)間段分,通過(guò)調(diào)研分別列出擋車(chē)工針對(duì)每個(gè)機(jī)種在三個(gè)時(shí)間段分別要查看的數(shù)據(jù)和進(jìn)行的操作。隨著模板的擴(kuò)充和完善,一線職工的知識(shí)、經(jīng)驗(yàn)不斷充實(shí)其中,第一層次應(yīng)用點(diǎn)模板將成為一線工人和三班管理干部日常應(yīng)用監(jiān)控的標(biāo)準(zhǔn),同時(shí)可以規(guī)避人員退休或調(diào)動(dòng)帶來(lái)的經(jīng)驗(yàn)、知識(shí)流失的風(fēng)險(xiǎn)。2、第二層次日常管理分析層。第二層次日常管理分析層,應(yīng)用主體是一般管理干部,應(yīng)用對(duì)象是產(chǎn)質(zhì)損、設(shè)備、動(dòng)能等指標(biāo),應(yīng)用目標(biāo)是通過(guò)加強(qiáng)對(duì)各類(lèi)考核指標(biāo)的監(jiān)控和分析,提高工廠整體的關(guān)鍵績(jī)效指標(biāo)水平。例如制絲車(chē)間的劣質(zhì)成本數(shù)據(jù)匯總和分析,通過(guò)對(duì)車(chē)間內(nèi)各類(lèi)廢物料、劣質(zhì)成本的數(shù)據(jù)進(jìn)行匯總、對(duì)比和分析,尋找其中規(guī)律及薄弱環(huán)節(jié),并尋根溯源,采取措施,降低劣質(zhì)成本。例如卷包車(chē)間的產(chǎn)量分析,通過(guò)對(duì)產(chǎn)量數(shù)據(jù)、工作日安排、計(jì)劃產(chǎn)量進(jìn)行統(tǒng)計(jì)和匯總,結(jié)合車(chē)間定額計(jì)劃、作業(yè)計(jì)劃和實(shí)際產(chǎn)量進(jìn)行分析,尋找實(shí)際生產(chǎn)情況與計(jì)劃間的差異,并分析原因。第二層次應(yīng)用以管理人員個(gè)性化的分析為主,呈現(xiàn)出分析方法多樣化、應(yīng)用工具多樣化的特點(diǎn)。但是萬(wàn)變不離其中的是每個(gè)管理崗位的管理目標(biāo)以及圍繞管理目標(biāo)開(kāi)展的分析應(yīng)用是相對(duì)固定的,至少在短期內(nèi)不會(huì)有太大的變化。為此我們建立了一份以重點(diǎn)崗位為脈絡(luò)的應(yīng)用點(diǎn)列表,圍繞脈絡(luò)對(duì)第二層次應(yīng)用點(diǎn)進(jìn)行梳理,形成第二層次應(yīng)用的規(guī)范化模板。模板包括崗位名稱(chēng)、管理目標(biāo)、應(yīng)用點(diǎn)名稱(chēng)、應(yīng)用描述、涉及主要考核指標(biāo)、應(yīng)用平臺(tái)、應(yīng)用頻次、分析去向等基本要素。通過(guò)構(gòu)建第二層次應(yīng)用點(diǎn)模板,明確了每個(gè)管理崗位應(yīng)用信息資源支撐管理目標(biāo)的內(nèi)容和職責(zé)。隨著新的管理目標(biāo)的不斷提出以及應(yīng)用的逐步深入,模板每年都會(huì)有更新和擴(kuò)充。3、第三層次針對(duì)性分析應(yīng)用層。第三層次針對(duì)性分析應(yīng)用層,應(yīng)用主體是項(xiàng)目實(shí)施者,應(yīng)用對(duì)象是各類(lèi)項(xiàng)目的實(shí)施過(guò)程,例如QC項(xiàng)目、六西格瑪項(xiàng)目、質(zhì)量改進(jìn)項(xiàng)目,或針對(duì)生產(chǎn)中的特定事件進(jìn)行的分析和研究。應(yīng)用目標(biāo)是通過(guò)應(yīng)用數(shù)據(jù)資源和統(tǒng)計(jì)方法開(kāi)展現(xiàn)狀調(diào)查、因果分析、效果驗(yàn)證等工作,提高各類(lèi)項(xiàng)目實(shí)施的嚴(yán)密性和科學(xué)性。第三層次的應(yīng)用工具在使用初級(jí)統(tǒng)計(jì)方法的基礎(chǔ)上會(huì)大量應(yīng)用包括方差分析、回歸分析、正交試驗(yàn)、假設(shè)檢驗(yàn)、流程圖等在內(nèi)的中級(jí)統(tǒng)計(jì)方法。以QC活動(dòng)為例,我們可以看出其實(shí)施過(guò)程無(wú)一不與數(shù)據(jù)應(yīng)用之間有密切的聯(lián)系[1]。近年來(lái),在質(zhì)量改進(jìn)項(xiàng)目和QC項(xiàng)目的評(píng)審工作中已逐步將“應(yīng)用數(shù)據(jù)說(shuō)話、運(yùn)用用正確合理的統(tǒng)計(jì)方法,提高解決問(wèn)題的科學(xué)性”作為項(xiàng)目質(zhì)量考核標(biāo)準(zhǔn)之一。而六西格瑪項(xiàng)目實(shí)施的核心思想更是強(qiáng)調(diào)“以數(shù)據(jù)和事實(shí)驅(qū)動(dòng)管理”,其五個(gè)階段[2]D(定義)、M(測(cè)量)、A(分析)、I(改善)、C(控制),每個(gè)階段都要求結(jié)合如FMEA(失效模式后果分析),SPC(統(tǒng)計(jì)流程控制),MSA(測(cè)量系統(tǒng)分析),ANOVE(方差分析),DOE(實(shí)驗(yàn)設(shè)計(jì))等統(tǒng)計(jì)方法和統(tǒng)計(jì)工具的應(yīng)用。4、第四層次主題性應(yīng)用層。第四層次主題性應(yīng)用層,應(yīng)用主體是中層管理者,應(yīng)用對(duì)象是專(zhuān)業(yè)性或綜合性的分析主題,應(yīng)用目標(biāo)是通過(guò)專(zhuān)業(yè)科室設(shè)計(jì)的專(zhuān)題性分析模型或綜合性分析模型,為中層管理層提供決策依據(jù)。工廠在實(shí)施了業(yè)務(wù)流程“自動(dòng)化”之后,產(chǎn)生了大量的數(shù)據(jù)和報(bào)表。如何將工廠的業(yè)務(wù)信息及時(shí)、精煉、明確地陳述給中層管理層,以此來(lái)正確地判斷工廠的生產(chǎn)經(jīng)營(yíng)狀況,是擺在我們眼前的一個(gè)突出問(wèn)題。大家都有開(kāi)車(chē)的經(jīng)驗(yàn),司機(jī)在駕駛車(chē)輛的時(shí)候,他所掌握的車(chē)況基本上是來(lái)自汽車(chē)的儀表盤(pán),在車(chē)輛行使的過(guò)程中,儀表盤(pán)指針的變化,告知汽車(chē)的車(chē)速、油料、水溫等的狀況,駕駛員只要有效地控制這些指標(biāo)在安全范圍之內(nèi),車(chē)子就能正常地運(yùn)行。我們不妨將儀表盤(pán)的理念移植于工廠,建立工廠關(guān)鍵指標(biāo)及運(yùn)行管理儀表盤(pán),將工廠的關(guān)鍵信息直觀地列在上面,及時(shí)提醒各級(jí)管理人員工廠生產(chǎn)運(yùn)營(yíng)是否正常。
⑴關(guān)鍵績(jī)效指標(biāo)監(jiān)控系統(tǒng)。對(duì)分布在各處的當(dāng)前及歷史數(shù)據(jù)進(jìn)行統(tǒng)一展示,以工廠關(guān)鍵績(jī)效指標(biāo)為中心,支持統(tǒng)計(jì)分析和挖掘,可為中層管理者提供工廠關(guān)鍵績(jī)效指標(biāo)一門(mén)式的查詢(xún)服務(wù),使各業(yè)務(wù)部門(mén)尋找、闡釋問(wèn)題產(chǎn)生的原因,以有效監(jiān)控各類(lèi)關(guān)鍵績(jī)效指標(biāo),及時(shí)采取改進(jìn)措施,提高生產(chǎn)經(jīng)營(yíng)目標(biāo)完成質(zhì)量。⑵系統(tǒng)運(yùn)行狀態(tài)監(jiān)控系統(tǒng)。通過(guò)數(shù)據(jù)采集、手工錄入等各種渠道收集各類(lèi)系統(tǒng)的運(yùn)行狀態(tài),及時(shí)掌握故障情況,采取措施加以閉環(huán),將因系統(tǒng)故障造成對(duì)用戶(hù)的影響減至最小,確保各類(lèi)系統(tǒng)的穩(wěn)定運(yùn)行和有效應(yīng)用。通過(guò)建立系統(tǒng)運(yùn)行狀態(tài)監(jiān)控系統(tǒng),中層管理人員上班一打開(kāi)電腦進(jìn)入系統(tǒng),就能了解到當(dāng)天及上一天各類(lèi)系統(tǒng)的運(yùn)轉(zhuǎn)情況,發(fā)生了什么異常,哪些故障已經(jīng)得到解決,哪些故障還未解決。⑶第四層次主題性分析應(yīng)用。在展示關(guān)鍵績(jī)效指標(biāo)和系統(tǒng)運(yùn)行狀態(tài)的基礎(chǔ)上,由各專(zhuān)業(yè)科室思考專(zhuān)業(yè)條線上的分析主題,采用先進(jìn)科學(xué)的理念和方法對(duì)數(shù)據(jù)進(jìn)行分析和挖掘。近兩年來(lái),工廠充分發(fā)揮專(zhuān)業(yè)科室的優(yōu)勢(shì)和力量,相繼設(shè)計(jì)和開(kāi)發(fā)了工藝質(zhì)量條線的六西格瑪測(cè)評(píng)系統(tǒng),設(shè)備條線的設(shè)備效能分析系統(tǒng),還有質(zhì)量成本核算與分析系統(tǒng)。通過(guò)這些分析主題的支持,工廠管理人員可以更方便快捷地了解質(zhì)量、設(shè)備、成本等條線上的關(guān)鍵信息,及時(shí)采取相應(yīng)措施,從而提升管理效率。
二、數(shù)據(jù)分析應(yīng)用工作存在的不足及思考
工廠數(shù)據(jù)分析應(yīng)用工作的推進(jìn)方法從最初的采用數(shù)據(jù)分析應(yīng)用率單個(gè)指標(biāo)進(jìn)行推進(jìn)發(fā)展到目前按上文所述的四個(gè)層次進(jìn)行推進(jìn),每個(gè)層次的推進(jìn)脈絡(luò)已經(jīng)逐步清晰和明朗,但事物發(fā)展到一定的階段總會(huì)達(dá)到一個(gè)瓶頸口,目前工廠數(shù)據(jù)分析應(yīng)用工作存在的問(wèn)題及措施思考如下:
1、從推進(jìn)手段上要突破信息條線,充分發(fā)揮專(zhuān)業(yè)條線的力量。信息條線作為推進(jìn)工廠數(shù)據(jù)分析應(yīng)用的主管條線,其作用往往局限在技術(shù)層面上的支撐。雖然信息條線每年都會(huì)規(guī)劃形成工廠數(shù)據(jù)分析應(yīng)用整體的工作思路和具體的實(shí)施計(jì)劃,但是無(wú)論從工廠層面還是從車(chē)間層面來(lái)講,單純依靠信息條線從側(cè)面加以引導(dǎo)和推進(jìn),使得數(shù)據(jù)分析應(yīng)用工作始終在業(yè)務(wù)條線的邊緣徘徊,與產(chǎn)量、質(zhì)量、設(shè)備、消耗、成本、動(dòng)能等各個(gè)條線本身工作的結(jié)合度有一定的距離。所以工廠要進(jìn)一步推進(jìn)數(shù)據(jù)分析應(yīng)用工作,調(diào)動(dòng)起業(yè)務(wù)人員的積極性和主動(dòng)性,突破現(xiàn)有的瓶頸,應(yīng)該考慮如何調(diào)動(dòng)起專(zhuān)業(yè)條線的力量。一是可以在年初策劃應(yīng)用點(diǎn)的時(shí)候要加強(qiáng)專(zhuān)業(yè)條線對(duì)車(chē)間業(yè)務(wù)自上而下的指導(dǎo),引導(dǎo)管理人員加強(qiáng)對(duì)缺少數(shù)據(jù)分析支撐的工序、崗位/管理目標(biāo)的思考;二是建立平臺(tái)加強(qiáng)各車(chē)間同性質(zhì)崗位之間的溝通與交流,均衡各個(gè)車(chē)間的數(shù)據(jù)分析應(yīng)用水平和能力;三是對(duì)車(chē)間提交的分析報(bào)告給出專(zhuān)業(yè)性的指導(dǎo)意見(jiàn)。2、要加強(qiáng)對(duì)數(shù)據(jù)中心的應(yīng)用。數(shù)據(jù)中心的建立可以使業(yè)務(wù)系統(tǒng)從報(bào)表制作、數(shù)據(jù)導(dǎo)出等功能中解放出來(lái),專(zhuān)注于事務(wù)處理,將數(shù)據(jù)應(yīng)用方面的功能完全交給數(shù)據(jù)中心來(lái)解決。目前,數(shù)據(jù)中心已建立了涉及產(chǎn)量、質(zhì)量、消耗等各個(gè)條線的Universe模型,并對(duì)全廠管理干部進(jìn)行了普及性的培訓(xùn)。但是從目前應(yīng)用情況來(lái)看,還比較局限于個(gè)別管理人員,追尋原因如下:一是業(yè)務(wù)系統(tǒng)開(kāi)發(fā)根據(jù)用戶(hù)需求定制開(kāi)發(fā)報(bào)表,業(yè)務(wù)人員通常習(xí)慣于從現(xiàn)成的報(bào)表中獲取信息。如果要求業(yè)務(wù)人員使用數(shù)據(jù)中心工具自行制作報(bào)表模板,甚至可能需要將其導(dǎo)出再作二次處理,那么業(yè)務(wù)人員一定更傾向于選擇第一種方式。二是近幾年來(lái)人員更替較多,新進(jìn)管理人員不熟悉數(shù)據(jù)中心應(yīng)用,導(dǎo)致數(shù)據(jù)中心應(yīng)用面受到限制。隨著今后MES的建設(shè),業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)、報(bào)表、臺(tái)帳和分析功能將有可能由業(yè)務(wù)用戶(hù)自行通過(guò)集成在MES中的數(shù)據(jù)中心前端開(kāi)發(fā)工具來(lái)訪問(wèn)和靈活定制。因此,要盡快培養(yǎng)工廠業(yè)務(wù)人員數(shù)據(jù)中心的應(yīng)用能力,包括數(shù)據(jù)獲取以及報(bào)表定制方面的技能。筆者認(rèn)為應(yīng)對(duì)方法如下:一是對(duì)于崗位人員變更做好新老人員之間一傳一的交接和培訓(xùn);二是適時(shí)針對(duì)新進(jìn)管理人員開(kāi)展集中培訓(xùn);三是通過(guò)采用一定的考核方法。3、提高新增應(yīng)用點(diǎn)的質(zhì)量。工廠每年都會(huì)組織各部門(mén)審視第一、第二層次應(yīng)用點(diǎn)列表,圍繞重點(diǎn)工序和重點(diǎn)管理崗位調(diào)研有哪些應(yīng)用上的空白點(diǎn)是需要重點(diǎn)思考的,以新增分析應(yīng)用點(diǎn)的方式進(jìn)行申報(bào)和實(shí)施。同時(shí)針對(duì)第三層次針對(duì)性分析應(yīng)用,工廠也會(huì)要求部門(mén)以新增分析應(yīng)用點(diǎn)的方式將需要數(shù)據(jù)支撐的項(xiàng)目進(jìn)行申報(bào)。作為一項(xiàng)常規(guī)性工作,工廠每年都會(huì)組織部門(mén)進(jìn)行應(yīng)用點(diǎn)的申報(bào),并按項(xiàng)目管理的思想和方法實(shí)施,事先確立各個(gè)應(yīng)用點(diǎn)的應(yīng)用層次、數(shù)據(jù)獲取方式、實(shí)現(xiàn)平臺(tái),并對(duì)其實(shí)施計(jì)劃進(jìn)行事先的思考和分解,確定每一個(gè)階段的活動(dòng)目標(biāo)、時(shí)間節(jié)點(diǎn)以及負(fù)責(zé)人員,每個(gè)季度對(duì)實(shí)施情況予以總結(jié),并動(dòng)態(tài)更新下一階段的實(shí)施計(jì)劃。該項(xiàng)工作從2005年起已經(jīng)連續(xù)開(kāi)展了三年,部門(mén)可供挖掘的應(yīng)用點(diǎn)越來(lái)越少,如何調(diào)動(dòng)部門(mén)的積極性,保持并提高應(yīng)用點(diǎn)的實(shí)效性,我們有必要對(duì)新增分析應(yīng)用點(diǎn)的質(zhì)量和實(shí)施情況進(jìn)行考評(píng),考評(píng)標(biāo)準(zhǔn)為:一是新增分析應(yīng)用點(diǎn)是否能體現(xiàn)數(shù)據(jù)應(yīng)用開(kāi)展的進(jìn)取性、開(kāi)拓性和創(chuàng)新性;二是新增分析應(yīng)用點(diǎn)是否能切實(shí)提高管理的精細(xì)化和科學(xué)化水平;三是新增分析應(yīng)用點(diǎn)是否能采用項(xiàng)目管理的思想和方法實(shí)施,按時(shí)間節(jié)點(diǎn)完成各項(xiàng)預(yù)定計(jì)劃。
三、結(jié)束語(yǔ)。隨著近幾年來(lái)技術(shù)平臺(tái)的相繼成熟以及管理手段的逐步推進(jìn),工廠業(yè)務(wù)人員用數(shù)據(jù)說(shuō)話的意識(shí)已經(jīng)越來(lái)越強(qiáng),但是要真正使工廠管理達(dá)到“三分技術(shù)、七分管理、十二分?jǐn)?shù)據(jù)”的水平,還有很長(zhǎng)的路要走,這既需要我們的業(yè)務(wù)人員從自身出發(fā)提高應(yīng)用數(shù)據(jù)的水平和能力,同時(shí)也需要工廠從管理手段和管理方法上不斷拓寬思路、創(chuàng)新手段,真正實(shí)現(xiàn)數(shù)據(jù)分析應(yīng)用成為工廠管理的重要支撐手段。
作者單位:上海卷煙廠
(一)統(tǒng)計(jì)規(guī)律分析
就是采用數(shù)理統(tǒng)計(jì)方法、模糊數(shù)學(xué)方法以及適用于小同環(huán)境要素的數(shù)學(xué)和物理方程等方法,對(duì)所得的監(jiān)測(cè)數(shù)據(jù)進(jìn)行深度剖析,做出詳細(xì)的分析評(píng)價(jià)。這種數(shù)據(jù)分析方法主要適用于環(huán)境調(diào)查、環(huán)境規(guī)劃和環(huán)評(píng)等工作。
(二)合理性分析
實(shí)際的環(huán)境監(jiān)測(cè)中,影響環(huán)境要素變化的因素錯(cuò)綜復(fù)雜,而有效的能用于綜合分析的監(jiān)測(cè)數(shù)據(jù)十分有限,所以我們需要考慮到各種環(huán)境要素之間的相互影響,以及監(jiān)測(cè)項(xiàng)目之間的關(guān)系,理論結(jié)合實(shí)際全面分析數(shù)據(jù)的合理性,這樣才可能得到準(zhǔn)確可靠的、合理的監(jiān)測(cè)數(shù)據(jù)分析結(jié)果。
二、提高環(huán)境監(jiān)測(cè)數(shù)據(jù)分析質(zhì)量的方法
為了促進(jìn)環(huán)境執(zhí)法工作的嚴(yán)肅和公正,在科學(xué)化環(huán)境管理政策中,提高環(huán)境數(shù)據(jù)分析質(zhì)量很有必要。在前人的研究工作基礎(chǔ)之上,我們提出了以下幾種方法來(lái)提高數(shù)據(jù)分析質(zhì)量。
(一)加強(qiáng)審核
加強(qiáng)各項(xiàng)審核是提高環(huán)境監(jiān)測(cè)數(shù)據(jù)分析質(zhì)量的重要方法,它主要是指加強(qiáng)對(duì)現(xiàn)有數(shù)據(jù)的綜合審核。在進(jìn)行例行監(jiān)測(cè)或是年度監(jiān)測(cè)計(jì)劃時(shí),我們的工作一般都是連續(xù)性的展開(kāi)的,一年或是好幾年,因此,我們可以建立一個(gè)動(dòng)態(tài)的分析數(shù)據(jù)庫(kù),錄入每次的監(jiān)測(cè)數(shù)據(jù),包括每個(gè)污染源的詳細(xì)信息(污染點(diǎn)的地理位置和排放口的排污狀況等),在以后的審核中,我們可以迅速地在數(shù)據(jù)審核中對(duì)于同一采樣點(diǎn)、同一分析項(xiàng)目進(jìn)行新舊數(shù)據(jù)的分析對(duì)比。當(dāng)數(shù)據(jù)分析結(jié)果出現(xiàn)異常時(shí),可以及時(shí)的發(fā)現(xiàn)并找到原因,這可以對(duì)污染應(yīng)急事故的發(fā)生起到提前警示的作用。另外,在數(shù)據(jù)審核中,也要密切注意到同一水樣、不同的分析項(xiàng)目之間的相關(guān)性,比如:同一水體中氟化物和總硬度、色度和pH的關(guān)系、氨氮和總氮之間的相關(guān)性等,這樣也能及時(shí)發(fā)現(xiàn)數(shù)據(jù)分析中出現(xiàn)的誤差。
(二)加強(qiáng)監(jiān)督機(jī)制
通過(guò)調(diào)研我們發(fā)現(xiàn),目前在傳統(tǒng)的監(jiān)測(cè)數(shù)據(jù)質(zhì)量控制系統(tǒng)中依舊存在許多不足,我們可以通過(guò)引入反饋和交流機(jī)制,加強(qiáng)監(jiān)督機(jī)制來(lái)有效提高數(shù)據(jù)分析的質(zhì)量。首先,通過(guò)強(qiáng)化平面控制,在系統(tǒng)內(nèi)部全面優(yōu)化管理的模式,提高工作人員的分析技術(shù)水平,盡可能的減少或消除數(shù)據(jù)誤差,以此來(lái)提高監(jiān)測(cè)分析的準(zhǔn)確性;其次,我們應(yīng)該主動(dòng)接受來(lái)自外界的監(jiān)督,對(duì)于外界有異議的監(jiān)測(cè)數(shù)據(jù)要進(jìn)行反復(fù)的檢測(cè);再次,我們也應(yīng)該多舉辦技術(shù)交流會(huì),讓技術(shù)人員可以與各級(jí)環(huán)境監(jiān)測(cè)部門(mén)的人員溝通,學(xué)習(xí)他們的先進(jìn)技術(shù)和方法,同時(shí)進(jìn)行數(shù)據(jù)分析結(jié)果對(duì)比,找到自身的不足,發(fā)現(xiàn)問(wèn)題并能及時(shí)更正。
(三)加強(qiáng)采樣及實(shí)驗(yàn)室測(cè)量質(zhì)量的控制
1.采樣控制
工作人員在每次采樣前,都應(yīng)該根據(jù)實(shí)際環(huán)境情況來(lái)制定采樣技術(shù)細(xì)則,做好采樣控制,比如:需要校準(zhǔn)儀器并確保儀器可以正常運(yùn)轉(zhuǎn);使用的采樣管和濾膜要正確安裝,采樣器干凈整潔沒(méi)有受到污染源的污染,其放置的位置也能滿(mǎn)足采樣要求等。采集好的樣品,要妥善存放避免污染。如果樣品不能及時(shí)進(jìn)行檢測(cè),考慮到樣品的穩(wěn)定性,最好將樣品密封并存放在于冰箱中。
2.實(shí)驗(yàn)室測(cè)量控制
在實(shí)驗(yàn)室進(jìn)行樣品測(cè)試之前,首先應(yīng)該對(duì)所要用到的玻璃量器及分析測(cè)試儀器進(jìn)行校驗(yàn)。日常工作中,也應(yīng)該根據(jù)各種儀器保養(yǎng)規(guī)定,對(duì)儀器定期進(jìn)行維護(hù)和校驗(yàn),確保儀器可以正常運(yùn)轉(zhuǎn)工作。其次,需要準(zhǔn)確調(diào)配各種溶液,特別是標(biāo)準(zhǔn)溶液,配置時(shí)要使用合格的實(shí)驗(yàn)用蒸餾水。測(cè)試數(shù)據(jù)時(shí),先要測(cè)定標(biāo)準(zhǔn)樣品并繪制標(biāo)準(zhǔn)曲線。測(cè)定樣品時(shí)要檢查相關(guān)系數(shù)和計(jì)算回歸方程,并對(duì)實(shí)驗(yàn)系統(tǒng)誤差進(jìn)行測(cè)驗(yàn),每一步都不能少。
分析網(wǎng)站流量這是首要工作,如果是網(wǎng)站建設(shè)初期,那么此時(shí)的流量分析就只要記住網(wǎng)站登陸搜索引擎后的流量基數(shù)即可。如果是網(wǎng)站建設(shè)中期的話,就要記錄網(wǎng)站流量一周的平均值,如果是網(wǎng)站建設(shè)后期的話,就要記錄網(wǎng)站流量的階段性波動(dòng)值!記錄好了流量值之后,就可以很好的計(jì)劃出下一步優(yōu)化推廣的流量值了。
網(wǎng)站優(yōu)化數(shù)據(jù)分析方法二:關(guān)鍵詞分析
網(wǎng)站關(guān)鍵詞分析也是網(wǎng)站優(yōu)化的重要工作之一!分析現(xiàn)在網(wǎng)站關(guān)鍵詞的布局,分析網(wǎng)站有流量的關(guān)鍵詞,分析網(wǎng)站還沒(méi)有覆蓋的與網(wǎng)站業(yè)務(wù)相關(guān)的關(guān)鍵詞,分析出網(wǎng)站主關(guān)鍵詞的排名情況,分析關(guān)鍵詞的設(shè)計(jì)是否合理。分析頂級(jí)關(guān)鍵詞是否占據(jù)了搜索引擎首頁(yè)的排名,分析搜索關(guān)鍵詞的質(zhì)量高不高,與網(wǎng)站業(yè)務(wù)的相關(guān)度如何?!分析關(guān)鍵詞轉(zhuǎn)化率如何等等。
中圖分類(lèi)號(hào):F01 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-0278(2013)02-024-01
在計(jì)量經(jīng)濟(jì)學(xué)中,我們一般應(yīng)用的最多的數(shù)據(jù)分析是截面數(shù)據(jù)回歸分析和時(shí)間序列分析,但截面數(shù)據(jù)分析和時(shí)間序列分析都有著一定的局限性。在實(shí)際經(jīng)濟(jì)研究當(dāng)中,截面數(shù)據(jù)回歸分析會(huì)遺漏掉數(shù)據(jù)的時(shí)間序列特征,例如在分析某年中國(guó)各省的GDP增長(zhǎng)數(shù)據(jù)時(shí),單純的截面數(shù)據(jù)回歸分析無(wú)法找出各省GDP隨時(shí)間變化的特征,使得分析結(jié)果沒(méi)有深度。而如果只用時(shí)間序列分析,則會(huì)遺漏掉不同截面間的聯(lián)系與區(qū)別,例如在分析中國(guó)單個(gè)省市的GDP隨時(shí)間增長(zhǎng)的數(shù)據(jù)時(shí),無(wú)法找出各個(gè)省市之間經(jīng)濟(jì)增長(zhǎng)的聯(lián)系與區(qū)別,因而同樣無(wú)法滿(mǎn)足我們的需要。而面板數(shù)據(jù),是一種既包括了時(shí)間序列數(shù)據(jù),也包括了相關(guān)截面數(shù)據(jù)的復(fù)合數(shù)據(jù),是近年來(lái)用得較多的一種數(shù)據(jù)類(lèi)型。
下面我們將基于2000-2009年中國(guó)各省GDP和財(cái)政收入的面板數(shù)據(jù)的實(shí)例來(lái)詳細(xì)闡述面板數(shù)據(jù)的分析方法。
一、GDP與財(cái)政收入關(guān)系的經(jīng)濟(jì)學(xué)模型
財(cái)政收入是保證國(guó)家有效運(yùn)轉(zhuǎn)的經(jīng)濟(jì)基礎(chǔ),在一國(guó)經(jīng)濟(jì)建設(shè)中發(fā)揮著重要作用。隨著中國(guó)經(jīng)濟(jì)發(fā)展速度的日益加快,財(cái)政收入不斷擴(kuò)大,而擴(kuò)大的財(cái)政收入又以政府支出來(lái)調(diào)節(jié)和推動(dòng)國(guó)民經(jīng)濟(jì)發(fā)展。正確認(rèn)識(shí)財(cái)政收入與經(jīng)濟(jì)增長(zhǎng)之間的長(zhǎng)期關(guān)系,把握財(cái)政收入與經(jīng)濟(jì)增長(zhǎng)之間的相互影響,發(fā)揮財(cái)政收入對(duì)經(jīng)濟(jì)發(fā)展的調(diào)節(jié)和促進(jìn)功能,對(duì)于完善財(cái)稅政策,深化財(cái)稅體制改革,實(shí)現(xiàn)財(cái)政與經(jīng)濟(jì)之間的良性互動(dòng),具有重要的現(xiàn)實(shí)意義。文章就將從中國(guó)各省的面板數(shù)據(jù)出發(fā)研究,中國(guó)不同地域間財(cái)政收入和GDP之間的關(guān)系。
二、實(shí)證分析
(一)單位根檢驗(yàn)
Eviews有兩種單位根檢驗(yàn)方法,一種在相同根的假設(shè)下的檢驗(yàn),包括LLC、Breintung、Hadri。另一種則是在不同根下的假設(shè)前提下,包括IPS,ADF-Fisher和PP-Fisher5。檢驗(yàn)結(jié)果表明所有檢驗(yàn)都拒絕原假設(shè),因此序列GDP和CZSR均為一個(gè)2階單整序列。
(二)協(xié)整檢驗(yàn)
如果基于單位根檢驗(yàn)的結(jié)果發(fā)現(xiàn)變量之間是同階單整的,那么我們可以進(jìn)行協(xié)整檢驗(yàn)。協(xié)整檢驗(yàn)是考察變量間長(zhǎng)期均衡關(guān)系的方法。所謂的協(xié)整是指若兩個(gè)或多個(gè)非平穩(wěn)的變量序列,其某個(gè)線性組合后的序列呈平穩(wěn)性。此時(shí)我們稱(chēng)這些變量序列間有協(xié)整關(guān)系存在。
在最終的結(jié)果中,Pedroni方法中除了rho-Statistic、PP-Statistic項(xiàng)目外都拒絕GDP和CZSR不存在協(xié)整關(guān)系的原假設(shè),同樣Kao和Johansen檢驗(yàn)方法也都拒絕原假設(shè),因此,上述檢驗(yàn)結(jié)果表明,我國(guó)各省2000-20009年的GDP和財(cái)政收入面板數(shù)據(jù)間存在著協(xié)整關(guān)系。既然通過(guò)了協(xié)整檢驗(yàn),說(shuō)明變量之間存在著長(zhǎng)期穩(wěn)定的均衡關(guān)系,其方程回歸殘差是平穩(wěn)的,因此可以在此基礎(chǔ)上直接對(duì)進(jìn)行回歸分析,此時(shí)假設(shè)方程的回歸結(jié)果是較精確的。
三、建立模型
混合模型:如果從時(shí)間上看,不同個(gè)體之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那么就可以直接把面板數(shù)據(jù)混合在一起用普通最小二乘法(OLS)估計(jì)參數(shù)。
我們根據(jù)混合模型的回歸結(jié)果,得到財(cái)政收入和GDP之間的回歸方程為:
CZSR=227.3123+0.103224*GDP
(26.47637)(0.002839)
R2=0.810995 F=1321.587
顯然從模型的回歸結(jié)構(gòu)來(lái)看,R2的值達(dá)到了0.81,有了比較好的回歸解釋力,同時(shí),GDP的回歸系數(shù)為0.103224,表明各省的財(cái)政收入平均占到了國(guó)民收入的10.3%左右。
變系數(shù)模型:顯然,在中國(guó)各省之間由于處在不同的地區(qū),因而擁有不同的區(qū)位優(yōu)勢(shì),那么各省的發(fā)展水平顯然就不一樣。正是由于這種不同的地方政策、管理水平、文化差異等會(huì)導(dǎo)致經(jīng)濟(jì)變量間出現(xiàn)一些關(guān)聯(lián)性的變化,此時(shí)在進(jìn)行模型回歸的時(shí)候,我們就有必要考慮變系數(shù)模型。
在回歸結(jié)果中,R2的值達(dá)到了0.97,比混合模型擁有更好的回歸解釋力,而在變系數(shù)模型回歸結(jié)果中,GDP的回歸系數(shù)大于0.5的只有、青海、寧夏三個(gè)省份,也就是說(shuō)這三個(gè)省份的財(cái)政收入占到了GDP的50%以上,他們同處于經(jīng)濟(jì)并不是很發(fā)達(dá)的西部地區(qū),由此可以看出,處在經(jīng)濟(jì)發(fā)達(dá)地區(qū)的財(cái)政收入占GDP的比重要低,而不發(fā)達(dá)地區(qū)則要高。
四、結(jié)論
通過(guò)以上的分析檢驗(yàn),我們發(fā)現(xiàn)針對(duì)于中國(guó)財(cái)政收入和GDP的面板數(shù)據(jù),我們應(yīng)建立起變系數(shù)模型,并通過(guò)模型分析,我們可以得出這樣的結(jié)論,中國(guó)各省間由于存在著地域經(jīng)濟(jì)發(fā)展水平不同、管理水平不同以及國(guó)家的相關(guān)政策等諸多不同,造成了各省之間在財(cái)政收入以及國(guó)民收入上面存在著一定的差異。而回歸結(jié)果也告訴我們,我國(guó)西部地區(qū)的財(cái)政收入占GDP的比例要明顯高于東部地區(qū),地區(qū)發(fā)展落后地區(qū)的財(cái)政收入占GDP的比例也要明顯高于東部地區(qū)。因此,這為我們改善我國(guó)落后地區(qū)的經(jīng)濟(jì)發(fā)展提供了一定的新思路,就是對(duì)一地區(qū)的稅收征收可以適當(dāng)放緩,而將GDP中以前政府占用的部分歸還于民眾和企業(yè),因?yàn)?,按照發(fā)達(dá)地區(qū)的經(jīng)驗(yàn)表明,財(cái)政收入所占比重過(guò)高,經(jīng)濟(jì)發(fā)展的活力或者就不會(huì)很高,對(duì)于進(jìn)一步刺激財(cái)政收入的增加也沒(méi)有任何幫助。因此,我們應(yīng)該適度降低財(cái)政收入占GDP的比重,從而增加經(jīng)濟(jì)活力,使西部地區(qū)以及落后地區(qū)及早的跟上東部發(fā)達(dá)地區(qū)的發(fā)展步伐,從而消除我國(guó)經(jīng)濟(jì)發(fā)展的地域不平衡。
參考文獻(xiàn):
[1]謝識(shí)予,朱洪鑫.高級(jí)計(jì)量經(jīng)濟(jì)學(xué)[M].復(fù)旦大學(xué)出版社,2005.
這就是為什么行業(yè)越來(lái)越傾向于使用特定的玩家反饋和可執(zhí)行的分析結(jié)果來(lái)指導(dǎo)游戲設(shè)計(jì)調(diào)整。
了解真實(shí)的玩家觀點(diǎn)并不容易。對(duì)發(fā)行商和開(kāi)發(fā)者而言,玩家、平臺(tái)和設(shè)備類(lèi)型多樣化導(dǎo)致分析學(xué)的數(shù)據(jù)追蹤成了一大挑戰(zhàn)。
那就是為什么我們最近發(fā)表了《Analytics Driven Game Design》白皮書(shū),旨在使這個(gè)過(guò)程更加簡(jiǎn)單和有效。
以下是一些重要的設(shè)計(jì)和執(zhí)行建議:
1、提前收集數(shù)據(jù)
人們往往不會(huì)把執(zhí)行分析學(xué)的數(shù)據(jù)標(biāo)注當(dāng)作優(yōu)先任務(wù)。
這是錯(cuò)誤的,因?yàn)閿?shù)據(jù)收集一般要貫穿整個(gè)開(kāi)發(fā)過(guò)程,需要的時(shí)間是執(zhí)行的三到五倍。
2、盡早收集事件數(shù)據(jù)
當(dāng)事件及其參數(shù)定義好時(shí),開(kāi)發(fā)者就可以確定什么時(shí)候需要什么數(shù)據(jù)了。
一開(kāi)始就把這樣的數(shù)據(jù)結(jié)構(gòu)結(jié)合到代碼中,可以保證當(dāng)代碼需要這些數(shù)據(jù)時(shí)就能有現(xiàn)成的數(shù)據(jù)。
如果把事件收集放在開(kāi)發(fā)過(guò)程的末尾,通常只能收集到60%有價(jià)值的數(shù)據(jù),這說(shuō)明沒(méi)有充分利用分析學(xué)。
3、統(tǒng)一視角
復(fù)雜的游戲通常涉及多個(gè)系統(tǒng)。例如,登錄系統(tǒng)可能不同于支付系統(tǒng),這意味著數(shù)據(jù)來(lái)源通常有兩個(gè):服務(wù)器和游戲客戶(hù)端。
因此,有必統(tǒng)一視角,即使戶(hù)ID與登錄活動(dòng)保持一致。
這樣,分析時(shí)就可以忽略數(shù)據(jù)來(lái)源,把所有信息放在一起。
4、同步時(shí)間標(biāo)記
類(lèi)似地,因?yàn)槭录?shù)據(jù)來(lái)自多個(gè)來(lái)源、時(shí)區(qū)和應(yīng)用商店,有必要使用同步時(shí)間標(biāo)記,以確保觀察玩家行為的視角能夠保持一致。
發(fā)送客戶(hù)端數(shù)據(jù)時(shí)通常使用本地時(shí)間標(biāo)記,而服務(wù)器數(shù)據(jù)記錄的通常是保存數(shù)據(jù)的時(shí)間。
如果兩個(gè)時(shí)間標(biāo)記不一樣,就會(huì)很難知道真正的事件順序,從而不利于建立玩家行為檔案。
5、創(chuàng)建單一登錄ID
將這個(gè)獨(dú)特的ID與一次登錄中發(fā)生的所有事件聯(lián)系在一起,對(duì)高效分析特別重要。
如果事件發(fā)生后才關(guān)聯(lián)數(shù)據(jù),必然會(huì)導(dǎo)致誤差和錯(cuò)誤。
考慮到大量初次玩家留存分析學(xué)專(zhuān)注于第一次游戲,統(tǒng)一而準(zhǔn)確地定義你的登錄活動(dòng)是很重要的。
6、總是記錄結(jié)果
事件的目標(biāo)應(yīng)該是記錄結(jié)果而不是變化。
換句話說(shuō),記錄任務(wù)的結(jié)果比記錄任務(wù)中的各種變化更好。例如,記錄當(dāng)玩家完成任務(wù)時(shí)獲得了什么,即得到多少經(jīng)驗(yàn)點(diǎn)或殺敵數(shù),比記錄每一次射擊更實(shí)用。
一、數(shù)據(jù)統(tǒng)計(jì)分析的內(nèi)涵
數(shù)據(jù)分析是指運(yùn)用一定的分析方法對(duì)數(shù)據(jù)進(jìn)行處理,從而獲得解決管理決策或營(yíng)銷(xiāo)研究問(wèn)題所需信息的過(guò)程。所謂的數(shù)據(jù)統(tǒng)計(jì)分析就是運(yùn)用統(tǒng)計(jì)學(xué)的方法對(duì)數(shù)據(jù)進(jìn)行處理。在實(shí)際的市場(chǎng)調(diào)研工作中,數(shù)據(jù)統(tǒng)計(jì)分析能使我們挖掘出數(shù)據(jù)中隱藏的信息,并以恰當(dāng)?shù)男问奖憩F(xiàn)出來(lái),并最終指導(dǎo)決策的制定。
二、數(shù)據(jù)統(tǒng)計(jì)分析的原則
(1)科學(xué)性??茖W(xué)方法的顯著特征是數(shù)據(jù)的收集、分析和解釋的客觀性,數(shù)據(jù)統(tǒng)計(jì)分析作為市場(chǎng)調(diào)研的重要組成部分也要具有同其他科學(xué)方法一樣的客觀標(biāo)準(zhǔn)。(2)系統(tǒng)性。市場(chǎng)調(diào)研是一個(gè)周密策劃、精心組織、科學(xué)實(shí)施,并由一系列工作環(huán)節(jié)、步驟、活動(dòng)和成果組成的過(guò)程,而不是單個(gè)資料的記錄、整理或分析活動(dòng)。(3)針對(duì)性。就不同的數(shù)據(jù)統(tǒng)計(jì)分析方法而言,無(wú)論是基礎(chǔ)的分析方法還是高級(jí)的分析方法,都會(huì)有它的適用領(lǐng)域和局限性。(4)趨勢(shì)性。市場(chǎng)所處的環(huán)境是在不斷的變化過(guò)程中的,我們要以一種發(fā)展的眼光看待問(wèn)題。(5)實(shí)用性。市場(chǎng)調(diào)研說(shuō)到底是為企業(yè)決策服務(wù)的,而數(shù)據(jù)統(tǒng)計(jì)分析也同樣服務(wù)于此,在保證其專(zhuān)業(yè)性和科學(xué)性的同時(shí)也不能忽略其現(xiàn)實(shí)意義。
三、推論性統(tǒng)計(jì)分析方法
(1)方差分析。方差分析是檢驗(yàn)多個(gè)總體均值是否相等的一種統(tǒng)計(jì)方法,它可以看作是t檢驗(yàn)的一種擴(kuò)展。它所研究的是分類(lèi)型自變量對(duì)數(shù)值型因變量的影響,比如它們之間有沒(méi)有關(guān)聯(lián)性、關(guān)聯(lián)性的程度等,所采用的方法就是通過(guò)檢驗(yàn)各個(gè)總體的均值是否相等來(lái)判斷分類(lèi)型自變量對(duì)數(shù)值型因變量是否有顯著影響。(2)回歸分析。在數(shù)據(jù)統(tǒng)計(jì)分析中,存在著大量的一種變量隨著另一種變量的變化而變化的情況,這種對(duì)應(yīng)的因果變化往往無(wú)法用精確的數(shù)學(xué)公式來(lái)描述,只有通過(guò)大量觀察數(shù)據(jù)的統(tǒng)計(jì)工作才能找到他們之間的關(guān)系和規(guī)律,解決這一問(wèn)題的常用方法是回歸分析?;貧w分析是從定量的角度對(duì)觀察數(shù)據(jù)進(jìn)行分析、計(jì)算和歸納。
四、多元統(tǒng)計(jì)分析方法
(1)相關(guān)分析。相關(guān)分析是描述兩組變量間的相關(guān)程度和方向的一種常用的統(tǒng)計(jì)方法。值得注意的是,事物之間有相關(guān)關(guān)系,不一定是因果關(guān)系,也可能僅僅是伴隨關(guān)系;但如果事物之間有因果關(guān)系,則兩者必然存在相關(guān)關(guān)系。(2)主成分分析。在大部分?jǐn)?shù)據(jù)統(tǒng)計(jì)分析中,變量之間是有一定的相關(guān)性的,人們自然希望找到較少的幾個(gè)彼此不相關(guān)的綜合指標(biāo)盡可能多地反映原來(lái)眾多變量的信息。所謂的主成分分析就是利用降維的思想,把多指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo)的多元統(tǒng)計(jì)分析方法,很顯然在一個(gè)低維空間識(shí)別系統(tǒng)要比在一個(gè)高維空間容易的多。(3)因子分析。因子分析的目的是使數(shù)據(jù)簡(jiǎn)單化,它是將具有錯(cuò)綜復(fù)雜關(guān)系的變量綜合為數(shù)量較少的幾個(gè)因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系,同時(shí)根據(jù)不同因子,對(duì)變量進(jìn)行分類(lèi)。這些因子是不可觀測(cè)的潛在變量,而原先的變量是可觀測(cè)的顯在變量。(4)聚類(lèi)分析。在市場(chǎng)調(diào)研中,市場(chǎng)細(xì)分是最常見(jiàn)的營(yíng)銷(xiāo)術(shù)語(yǔ)之一,它按照一定的標(biāo)準(zhǔn)將市場(chǎng)分割為不同的族群,并使族群之間具有某種特征的顯著差異,而族群內(nèi)部在這種特征上具有相似性。聚類(lèi)分析就是實(shí)現(xiàn)分類(lèi)的一種多元統(tǒng)計(jì)分析方法,它根據(jù)聚類(lèi)變量將樣本分成相對(duì)同質(zhì)的族群。聚類(lèi)分析的主要優(yōu)點(diǎn)是,對(duì)所研究的對(duì)象進(jìn)行了全面的綜合分析,歸類(lèi)比較客觀,有利于分類(lèi)指導(dǎo)。(5)判別分析。判別分析是判別樣品所屬類(lèi)型的一種多元統(tǒng)計(jì)方法。若在已知的分類(lèi)下,遇到新的樣本,則可利用此法選定一種判別標(biāo)準(zhǔn),以判定將該新樣品放置于哪個(gè)類(lèi)中。由定義我們可以知道判別分析區(qū)別于聚類(lèi)分析的地方,而在判別分析中,至少要有一個(gè)已經(jīng)明確知道類(lèi)別的“訓(xùn)練樣本”,從而利用這個(gè)數(shù)據(jù)建立判別準(zhǔn)則,并通過(guò)預(yù)測(cè)變量來(lái)為未知類(lèi)別的觀測(cè)值進(jìn)行判別。與聚類(lèi)分析相同的地方是,判別分析也是利用距離的遠(yuǎn)近來(lái)把對(duì)象歸類(lèi)的。
參考文獻(xiàn)
一、數(shù)據(jù)統(tǒng)計(jì)分析的內(nèi)涵
數(shù)據(jù)分析是指運(yùn)用一定的分析方法對(duì)數(shù)據(jù)進(jìn)行處理,從而獲得解決管理決策或營(yíng)銷(xiāo)研究問(wèn)題所需信息的過(guò)程。所謂的數(shù)據(jù)統(tǒng)計(jì)分析就是運(yùn)用統(tǒng)計(jì)學(xué)的方法對(duì)數(shù)據(jù)進(jìn)行處理。在實(shí)際的市場(chǎng)調(diào)研工作中,數(shù)據(jù)統(tǒng)計(jì)分析能使我們挖掘出數(shù)據(jù)中隱藏的信息,并以恰當(dāng)?shù)男问奖憩F(xiàn)出來(lái),并最終指導(dǎo)決策的制定。
二、數(shù)據(jù)統(tǒng)計(jì)分析的原則
(1)科學(xué)性??茖W(xué)方法的顯著特征是數(shù)據(jù)的收集、分析和解釋的客觀性,數(shù)據(jù)統(tǒng)計(jì)分析作為市場(chǎng)調(diào)研的重要組成部分也要具有同其他科學(xué)方法一樣的客觀標(biāo)準(zhǔn)。(2)系統(tǒng)性。市場(chǎng)調(diào)研是一個(gè)周密策劃、精心組織、科學(xué)實(shí)施,并由一系列工作環(huán)節(jié)、步驟、活動(dòng)和成果組成的過(guò)程,而不是單個(gè)資料的記錄、整理或分析活動(dòng)。(3)針對(duì)性。就不同的數(shù)據(jù)統(tǒng)計(jì)分析方法而言,無(wú)論是基礎(chǔ)的分析方法還是高級(jí)的分析方法,都會(huì)有它的適用領(lǐng)域和局限性。(4)趨勢(shì)性。市場(chǎng)所處的環(huán)境是在不斷的變化過(guò)程中的,我們要以一種發(fā)展的眼光看待問(wèn)題。(5)實(shí)用性。市場(chǎng)調(diào)研說(shuō)到底是為企業(yè)決策服務(wù)的,而數(shù)據(jù)統(tǒng)計(jì)分析也同樣服務(wù)于此,在保證其專(zhuān)業(yè)性和科學(xué)性的同時(shí)也不能忽略其現(xiàn)實(shí)意義。
三、推論性統(tǒng)計(jì)分析方法
(1)方差分析。方差分析是檢驗(yàn)多個(gè)總體均值是否相等的一種統(tǒng)計(jì)方法,它可以看作是t檢驗(yàn)的一種擴(kuò)展。它所研究的是分類(lèi)型自變量對(duì)數(shù)值型因變量的影響,比如它們之間有沒(méi)有關(guān)聯(lián)性、關(guān)聯(lián)性的程度等,所采用的方法就是通過(guò)檢驗(yàn)各個(gè)總體的均值是否相等來(lái)判斷分類(lèi)型自變量對(duì)數(shù)值型因變量是否有顯著影響。(2)回歸分析。在數(shù)據(jù)統(tǒng)計(jì)分析中,存在著大量的一種變量隨著另一種變量的變化而變化的情況,這種對(duì)應(yīng)的因果變化往往無(wú)法用精確的數(shù)學(xué)公式來(lái)描述,只有通過(guò)大量觀察數(shù)據(jù)的統(tǒng)計(jì)工作才能找到他們之間的關(guān)系和規(guī)律,解決這一問(wèn)題的常用方法是回歸分析?;貧w分析是從定量的角度對(duì)觀察數(shù)據(jù)進(jìn)行分析、計(jì)算和歸納。
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2017)03-62-03
Abstract: This paper puts forward a method of analyzing public opinion and satisfaction on the evaluation data of scenic spots based on tourist demand template. By means of keywords template library building and expansion based on the template of tourism demand, the paper analyses and builds the model of the public opinion and satisfaction on the evaluation data. It solves the problem that unstructured content such as tourists' travels and evaluation cannot be efficiently searched and utilized by other tourists. It can not only provide tourists with scenic spots' comprehensive satisfaction value, but also satisfaction values in the specific area of cuisine, housing, transportation, travelling, shopping, and entertainment, and even more specific related content of the satisfaction value in those six aspects. Thus it helps visitors quickly understand the evaluation of the various parameters of the area.
Key words: template library; public opinion of scenic spots; satisfaction; evaluation data
0 引言
隨著經(jīng)濟(jì)的發(fā)展,現(xiàn)在已經(jīng)進(jìn)入旅游智能化階段和大數(shù)據(jù)的時(shí)代,游客通常通過(guò)查看媒體互動(dòng)分享評(píng)價(jià)來(lái)決定自己旅游計(jì)劃。然而,傳統(tǒng)游客在游記中對(duì)景區(qū)景點(diǎn)的評(píng)價(jià)內(nèi)容是非結(jié)構(gòu)化、離散的,即難以采用一定的算法對(duì)其進(jìn)行有規(guī)律地提取和組織,從而導(dǎo)致不能采用計(jì)算機(jī)智能對(duì)其提取分類(lèi)。然而游客對(duì)“吃、住、行、游、購(gòu)、娛”的評(píng)價(jià)獲取需求頗為急切,因此需要采用一種新的技術(shù)來(lái)實(shí)現(xiàn)游客評(píng)價(jià)的自動(dòng)化提取并對(duì)大量的數(shù)據(jù)進(jìn)行高效的有價(jià)值的分析[1-3]。
1 本文提出的方法步驟及特征
本文提出一種基于旅游需求模板的景區(qū)評(píng)價(jià)數(shù)據(jù)分析輿情滿(mǎn)意度方法,主要有基于旅游需求模板的關(guān)鍵詞模板庫(kù)構(gòu)建(見(jiàn)圖1)、關(guān)鍵詞模板庫(kù)的擴(kuò)充(見(jiàn)圖2)和針對(duì)景區(qū)評(píng)價(jià)數(shù)據(jù)的輿情滿(mǎn)意度分析計(jì)算三個(gè)步驟。該方法的特征在于:所述的旅游需求模板主要由內(nèi)容大類(lèi)關(guān)鍵詞、內(nèi)容子類(lèi)關(guān)鍵詞和情感關(guān)鍵詞構(gòu)成,每個(gè)內(nèi)容大類(lèi)關(guān)鍵詞下分屬有其對(duì)應(yīng)的內(nèi)容子類(lèi)關(guān)鍵詞,每個(gè)內(nèi)容子類(lèi)關(guān)鍵詞下分屬有其對(duì)應(yīng)的情感關(guān)鍵詞[4-5]。
1.1 基于旅游需求模板的關(guān)鍵詞模板庫(kù)構(gòu)建
主要由基于旅游需求模板引導(dǎo)評(píng)價(jià)的內(nèi)容大類(lèi)關(guān)鍵詞、內(nèi)容子類(lèi)關(guān)鍵詞和情感關(guān)鍵詞構(gòu)成,每個(gè)內(nèi)容大類(lèi)關(guān)鍵詞下分屬有其對(duì)應(yīng)的內(nèi)容子類(lèi)關(guān)鍵詞,每個(gè)內(nèi)容子類(lèi)關(guān)鍵詞下分屬有其對(duì)應(yīng)的情感關(guān)鍵詞。
關(guān)鍵詞模板庫(kù)初始由列舉而成,所述的內(nèi)容大類(lèi)關(guān)鍵詞包括吃、住、行、游、購(gòu)、娛的六個(gè)類(lèi)別;所述的內(nèi)容子類(lèi)關(guān)鍵詞是在內(nèi)容大類(lèi)關(guān)鍵詞的基礎(chǔ)上構(gòu)建的;所述情感關(guān)鍵詞是對(duì)內(nèi)容子類(lèi)關(guān)鍵詞的描述性詞語(yǔ)。
1.2 關(guān)鍵詞模板庫(kù)的擴(kuò)充
關(guān)鍵詞模板庫(kù)的擴(kuò)充具體是采用以下方式對(duì)內(nèi)容子類(lèi)關(guān)鍵詞和情感關(guān)鍵詞進(jìn)行擴(kuò)充:
⑴ 在已構(gòu)建的關(guān)鍵詞模板庫(kù)基礎(chǔ)上,通過(guò)網(wǎng)絡(luò)爬蟲(chóng)工具在內(nèi)容大類(lèi)關(guān)鍵詞所在段落文字附近搜索內(nèi)容子類(lèi)關(guān)鍵詞,將找到的在已構(gòu)建關(guān)鍵詞模板庫(kù)中不存在的內(nèi)容子類(lèi)關(guān)鍵詞作為新的內(nèi)容子類(lèi)關(guān)鍵詞,并加入到關(guān)鍵詞模板庫(kù)中;
⑵ 在已構(gòu)建的關(guān)鍵詞模板庫(kù)基礎(chǔ)上,通過(guò)網(wǎng)絡(luò)爬蟲(chóng)工具在內(nèi)容子類(lèi)關(guān)鍵詞所在段落文字附近搜索情感關(guān)鍵詞,將找到的在已構(gòu)建關(guān)鍵詞模板庫(kù)中不存在的情感關(guān)鍵詞作為新的情感關(guān)鍵詞,對(duì)新的情感關(guān)鍵詞賦權(quán)值后加入到關(guān)鍵詞模板庫(kù)中。
1.3 針對(duì)景區(qū)評(píng)價(jià)數(shù)據(jù)的輿情滿(mǎn)意度分析計(jì)算
所述針對(duì)景區(qū)評(píng)價(jià)數(shù)據(jù)的輿情滿(mǎn)意度分析計(jì)算具體是:由擴(kuò)充后的關(guān)鍵詞模板庫(kù)通過(guò)網(wǎng)絡(luò)爬蟲(chóng)工具搜索景區(qū)下的文字?jǐn)?shù)據(jù),抽取出內(nèi)容大類(lèi)關(guān)鍵詞所在段落文字附近的內(nèi)容子類(lèi)關(guān)鍵詞,再搜索抽取出每個(gè)內(nèi)容子類(lèi)關(guān)鍵詞所在段落文字附近的情感關(guān)鍵詞,從而獲得所有情感關(guān)鍵詞及其每個(gè)情感關(guān)鍵詞對(duì)應(yīng)的內(nèi)容子類(lèi)關(guān)鍵詞和內(nèi)容大類(lèi)關(guān)鍵詞,然后構(gòu)建景區(qū)輿情與滿(mǎn)意度的分析模型,通過(guò)景區(qū)輿情與滿(mǎn)意度的分析模型獲得以平均滿(mǎn)意度值作為該景區(qū)的輿情滿(mǎn)意度值。
2 景區(qū)輿情與滿(mǎn)意度的分析模型
⑴ 先采用以下公式計(jì)算獲得文字?jǐn)?shù)據(jù)中所有評(píng)論中的關(guān)于某一個(gè)內(nèi)容子類(lèi)關(guān)鍵詞的滿(mǎn)意度值:
其中,表示第i個(gè)內(nèi)容大類(lèi)關(guān)鍵詞下第j個(gè)內(nèi)容子類(lèi)關(guān)鍵詞的平均滿(mǎn)意度值,t是分值(1~5),表示i個(gè)內(nèi)容大類(lèi)關(guān)鍵詞下第j個(gè)內(nèi)容子類(lèi)關(guān)鍵詞對(duì)應(yīng)分值為t的情感關(guān)鍵詞的數(shù)量,Bij表示第i個(gè)內(nèi)容大類(lèi)關(guān)鍵詞下第j個(gè)內(nèi)容子類(lèi)關(guān)鍵詞,B{B11,B12,B13…B21,B22,B23…}代表內(nèi)容子類(lèi)關(guān)鍵詞集合。
⑵ 再采用以下公式計(jì)算獲得文字?jǐn)?shù)據(jù)中一個(gè)內(nèi)容大類(lèi)關(guān)鍵詞的滿(mǎn)意度值:
其中,表示第i個(gè)內(nèi)容大類(lèi)關(guān)鍵詞的滿(mǎn)意度值,表示第i個(gè)內(nèi)容大類(lèi)關(guān)鍵詞下第j個(gè)內(nèi)容子類(lèi)關(guān)鍵詞的權(quán)值,n表示第i個(gè)內(nèi)容大類(lèi)關(guān)鍵詞下內(nèi)容子類(lèi)關(guān)鍵詞的數(shù)量,A{A1,A2,…,A6}代表內(nèi)容大類(lèi)關(guān)鍵詞集合。
⑶ 再采用以下公式計(jì)算獲得該景區(qū)的綜合滿(mǎn)意度值:
其中,Y表示景區(qū)的綜合滿(mǎn)意度值,i表示內(nèi)容大類(lèi)關(guān)鍵詞的序號(hào),i取值范圍是1~6,表示第i個(gè)內(nèi)容大類(lèi)關(guān)鍵詞下的的權(quán)值。
3 具體實(shí)施方式
3.1 基于旅游需求模板的關(guān)鍵詞模板庫(kù)構(gòu)建
⑴ 內(nèi)容大類(lèi)關(guān)鍵詞構(gòu)建,主要包括吃、住、行、游、購(gòu)、娛幾個(gè)大類(lèi)。
⑵ 內(nèi)容子類(lèi)關(guān)鍵詞構(gòu)建,主要是在內(nèi)容大類(lèi)關(guān)鍵詞的基礎(chǔ)上構(gòu)建,比如和內(nèi)容大類(lèi)關(guān)鍵詞吃相關(guān)的內(nèi)容子類(lèi)關(guān)鍵詞有飯店、餐館、快餐店、小吃街等。
⑶ 情感關(guān)鍵詞構(gòu)建,主要是在內(nèi)容子類(lèi)關(guān)鍵詞基礎(chǔ)上構(gòu)建,比如和內(nèi)容子類(lèi)關(guān)鍵詞‘吃’對(duì)應(yīng)的情感關(guān)鍵詞有味道很好,價(jià)格實(shí)惠,環(huán)境優(yōu)美等。
3.2 關(guān)鍵詞模板庫(kù)的擴(kuò)充
⑴ 基于需求模板引導(dǎo)評(píng)價(jià)的內(nèi)容子類(lèi)關(guān)鍵詞庫(kù)擴(kuò)充,通過(guò)網(wǎng)絡(luò)爬蟲(chóng)工具在內(nèi)容大類(lèi)關(guān)鍵詞附近搜索相關(guān)的內(nèi)容子類(lèi)關(guān)鍵詞并與已有的模板庫(kù)進(jìn)行對(duì)比,遇到新的內(nèi)容子類(lèi)關(guān)鍵詞后,自動(dòng)加入到模板庫(kù),比如遇到與內(nèi)容大類(lèi)關(guān)鍵詞吃相關(guān)的新的內(nèi)容子類(lèi)關(guān)鍵詞野味店等。
⑵ 基于需求模板引導(dǎo)評(píng)價(jià)的情感關(guān)鍵詞庫(kù)擴(kuò)充,通過(guò)網(wǎng)絡(luò)爬蟲(chóng)工具八爪魚(yú)采集器,在內(nèi)容子類(lèi)關(guān)鍵詞附近搜索相關(guān)的情感關(guān)鍵詞并與已有的模板庫(kù)進(jìn)行對(duì)比,遇到新的情感關(guān)鍵詞后,自動(dòng)加入到模板庫(kù)。
⑶ 情感關(guān)鍵詞均已由用戶(hù)進(jìn)行賦分,給出分值(1~5),比如非常好/棒極了/美妙極了,這三個(gè)情感詞表達(dá)的滿(mǎn)意度是相同的,對(duì)應(yīng)的分值都是5分,一般/湊合/還行對(duì)應(yīng)的分值則都是3分;差極了/難受死了/簡(jiǎn)直就是受罪/再也不會(huì)去了,對(duì)應(yīng)的分值則是1分。
3.3 針對(duì)景區(qū)評(píng)價(jià)數(shù)據(jù)的輿情滿(mǎn)意度分析計(jì)算
⑴ 根據(jù)已有模版庫(kù)構(gòu)建評(píng)價(jià)體系表。內(nèi)容大類(lèi)關(guān)鍵詞和內(nèi)容子類(lèi)關(guān)鍵詞的權(quán)重和情感關(guān)鍵詞的分值以及相同分值評(píng)論數(shù)量如表1所示,表中{}表示第i個(gè)內(nèi)容大類(lèi)關(guān)鍵詞下第j個(gè)內(nèi)容子類(lèi)關(guān)鍵詞對(duì)應(yīng)分值為t的情感關(guān)鍵詞的集合。
⑵ 通過(guò)網(wǎng)絡(luò)爬蟲(chóng)工具搜索景區(qū)網(wǎng)頁(yè)的每個(gè)帖子,按內(nèi)容子類(lèi)關(guān)鍵詞,搜索所有相關(guān)的情感關(guān)鍵詞,根據(jù)表1進(jìn)行分類(lèi)統(tǒng)計(jì),把相應(yīng)的情感關(guān)鍵詞的數(shù)量記錄到對(duì)應(yīng)到中。
比如:通過(guò)網(wǎng)絡(luò)爬蟲(chóng)工具搜到網(wǎng)頁(yè)得到1000個(gè)情感關(guān)鍵詞,有600個(gè)是與內(nèi)容大類(lèi)關(guān)鍵詞‘吃A1’有關(guān)的,其中300個(gè)是與內(nèi)容子類(lèi)關(guān)鍵詞‘味道B11’有關(guān)的,對(duì)應(yīng)的情感關(guān)鍵詞集{}及數(shù)量如表2所示。
由內(nèi)容子類(lèi)關(guān)鍵詞滿(mǎn)意度計(jì)算公式可知該景區(qū)關(guān)于吃的味道的滿(mǎn)意度值為:
即:該景區(qū)關(guān)于吃的味道的滿(mǎn)意度值為3.6,同理可以計(jì)算其他內(nèi)容子類(lèi)的關(guān)鍵詞的滿(mǎn)意度值。
4 結(jié)束語(yǔ)
通過(guò)這種方法得到滿(mǎn)意度值,解決了以往游客的游記、評(píng)價(jià)等非結(jié)構(gòu)化內(nèi)容難以被其他游客高效搜索利用的問(wèn)題,除了可以向游客提供某個(gè)景區(qū)的綜合滿(mǎn)意度值外,還可以向游客提供該景區(qū)具體的關(guān)于吃、住、行、游、購(gòu)、娛六個(gè)方面的滿(mǎn)意度值,以及比吃、住、行、游、購(gòu)、娛更具體的相關(guān)內(nèi)容子類(lèi)關(guān)鍵詞的滿(mǎn)意度值,讓游客快速了解該景區(qū)的各個(gè)評(píng)價(jià)參數(shù)。
參考文獻(xiàn)(References):
[1] 維克托.邁爾舍恩伯格著,盛楊燕,周濤譯.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].浙江人民出版社,2013.
[2] 馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應(yīng)用[J].國(guó)防科技,2013.2:10-11
所謂的交通事故預(yù)測(cè)是根據(jù)已發(fā)生交通事故的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),在對(duì)事故原因進(jìn)行分析的基礎(chǔ)上,探尋事故規(guī)律,以針對(duì)交通事故做出更為合理的推測(cè)和判斷。當(dāng)前,交通事故預(yù)測(cè)方法相對(duì)較為多樣,如回歸分析、時(shí)間序列等,雖然都能對(duì)交通事故做出科學(xué)合理的決策性指導(dǎo),但各具優(yōu)缺點(diǎn)和適用條件,因而有關(guān)人員應(yīng)在遵循交通事故預(yù)測(cè)思想的基礎(chǔ)上,對(duì)幾種主要預(yù)測(cè)方法進(jìn)行分析,確保交通部門(mén)人員能夠根據(jù)實(shí)際情況而合理選擇交通事故預(yù)測(cè)方法。
1 交通事故預(yù)測(cè)思想
交通事故對(duì)人類(lèi)造成的危害相對(duì)較大,對(duì)人類(lèi)產(chǎn)生嚴(yán)重的威脅。從我國(guó)發(fā)展實(shí)踐中可知,交通事故在一定程度上制約我國(guó)經(jīng)濟(jì)的發(fā)展進(jìn)程,尤其對(duì)人類(lèi)社會(huì)福利、醫(yī)療保險(xiǎn)等方面的影響較大。據(jù)不完全統(tǒng)計(jì),2015年全年間,我國(guó)交通事故約為10597358起,死亡人數(shù)約為68432人,財(cái)產(chǎn)損失高達(dá)10億元以上。可見(jiàn),交通事故威脅隱患相對(duì)較大。交通事故預(yù)測(cè)能夠根據(jù)已發(fā)生交通事故進(jìn)行統(tǒng)計(jì)、分析、處理,在遵循規(guī)律的基礎(chǔ)上,對(duì)未來(lái)可能發(fā)生的交通事故作出科學(xué)合理的預(yù)測(cè),該預(yù)測(cè)結(jié)果以科學(xué)邏輯推斷為基礎(chǔ)。就交通事故原因而言,道路環(huán)境、交通條件、車(chē)輛、駕駛員等都是影響因素。通過(guò)交通事故預(yù)測(cè),我國(guó)交通部門(mén)人員能夠?qū)煌ㄊ鹿首鞒隹茖W(xué)合理的判斷和制定有效的預(yù)防策略,以最大限度降低和消除交通事故隱患。
2 交通事故主要預(yù)測(cè)方法
2.1 回歸分析預(yù)測(cè)法
回歸分析預(yù)測(cè)法在交通事故預(yù)測(cè)中的有效應(yīng)用,主要分為線性回歸和非線性回歸兩種方法。首先,背景交通工程研究所人員提出線性回歸分析預(yù)測(cè)法,通過(guò)對(duì)自變量和因變量之間關(guān)系問(wèn)題的探討,對(duì)因變量趨勢(shì)加以預(yù)測(cè),其模型為:
Y=3577.79+93.3028lgX1+824.921lgX3+326.777lgX4+800.454lgX5-1149.051lgX6-224.902lgX8-45.0499lgX9-152.6081lgX10-287.191lgX11。
其中X1-X11分別表示臨時(shí)人口、常住人口、機(jī)動(dòng)車(chē)輛、自行車(chē)、道路長(zhǎng)度、道路面積、燈控路口、交通標(biāo)志、交通標(biāo)線、失控部位、交警人數(shù)。
其次,英國(guó)倫敦大學(xué)SemeedR.J教授對(duì)歐洲國(guó)家十余載的交通事故資料進(jìn)行研究,提出非線性回歸分析預(yù)測(cè)法。對(duì)此,他建立冪函數(shù)曲線事故模型,
即:D=0.0003。其中D為交通事故死亡人數(shù);N是機(jī)動(dòng)車(chē)保有量;P為人口數(shù)量。
回歸分析預(yù)測(cè)法能夠?qū)煌ㄊ鹿视绊懸蛩亻g的因果關(guān)系加以反應(yīng),以達(dá)到預(yù)測(cè)結(jié)果的目的,但對(duì)變化趨勢(shì)的反應(yīng)可能較為遲鈍。該預(yù)測(cè)方法適用于樣本量較大、數(shù)據(jù)波動(dòng)小和極具規(guī)律性的預(yù)測(cè)實(shí)踐中。
2.2 時(shí)間序列預(yù)測(cè)法
時(shí)間序列預(yù)測(cè)法主要有兩種類(lèi)型,分別為移動(dòng)平均預(yù)測(cè)法和指數(shù)平滑預(yù)測(cè)法。首先,移動(dòng)平均預(yù)測(cè)法是比較簡(jiǎn)單的平滑預(yù)測(cè)技術(shù),通過(guò)計(jì)算項(xiàng)數(shù)時(shí)序平均值,對(duì)長(zhǎng)期發(fā)展趨勢(shì)變化做出科學(xué)合理的預(yù)測(cè)。內(nèi)蒙古科技大學(xué)韋麗琴、徐勇勇利用時(shí)間序列ARIMA模型做出科學(xué)合理的預(yù)測(cè)分析,對(duì)交通事故加以預(yù)測(cè)。其次,指數(shù)平滑預(yù)測(cè)法的通式為:
Ft+1=αxt+(1-α)Ft
時(shí)間序列預(yù)測(cè)法屬于定量預(yù)測(cè)方法,擬合效果良好,但在短期預(yù)測(cè)中,受諸多因素干擾影響較大,使預(yù)測(cè)結(jié)果具有不確定性。該方法適用于國(guó)內(nèi)縣區(qū)等區(qū)域范圍較小的預(yù)測(cè)實(shí)踐中。
2.3 灰色馬爾科夫鏈預(yù)測(cè)法
道路交通系統(tǒng)屬于動(dòng)態(tài)時(shí)變系統(tǒng),但影響交通安全的因素多且復(fù)雜。在灰色馬爾科夫鏈預(yù)測(cè)法的指導(dǎo)下,相關(guān)人員能夠通過(guò)灰色預(yù)測(cè)模型,做出短期預(yù)測(cè),以縮小預(yù)測(cè)區(qū)間,提高預(yù)測(cè)效率。云南交通職業(yè)技術(shù)學(xué)院王剛對(duì)灰色馬爾科夫鏈預(yù)測(cè)法而建立模型,對(duì)交通事故進(jìn)行預(yù)測(cè),根據(jù)實(shí)踐可知,基于該模型的預(yù)測(cè)精確度十分高,取得良好的預(yù)測(cè)成效。
灰色預(yù)測(cè)以短期預(yù)測(cè)為主,馬爾科夫鏈預(yù)測(cè)以長(zhǎng)期預(yù)測(cè)為主,通過(guò)二者結(jié)合,可提高預(yù)測(cè)精度,但如若數(shù)據(jù)變化大,則灰色模型的吻合度和精度下降。借助該預(yù)測(cè)方法,能夠?qū)顟B(tài)下的轉(zhuǎn)移規(guī)律加以預(yù)測(cè),并揭示交通事故時(shí)序變化總趨勢(shì)。
2.4 貝葉斯預(yù)測(cè)法
貝葉斯預(yù)測(cè)法主要相對(duì)于交通事故中的車(chē)速問(wèn)題而言。在交通事故中,車(chē)速是重要影響因素,如若車(chē)輛速度過(guò)快,則駕駛員反應(yīng)的時(shí)間較少,其應(yīng)急策略不足,造成重大交通安全隱患。貝葉斯預(yù)測(cè)法能夠?qū)ξ磥?lái)交通事故發(fā)生的可能性進(jìn)行預(yù)測(cè)。該預(yù)測(cè)方法應(yīng)用中,必須建立在交通事故和車(chē)速有關(guān)聯(lián)的基礎(chǔ)之上,有助于交通部門(mén)人員更好開(kāi)展數(shù)據(jù)統(tǒng)計(jì)和交通流進(jìn)行觀測(cè)。
2.5 灰關(guān)聯(lián)分析及神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法
就灰關(guān)聯(lián)分析及神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法而言,哈爾濱工業(yè)大學(xué)交通研究所和中國(guó)城市規(guī)劃設(shè)計(jì)研究院的裴玉龍與張宇提出該方法,旨在通過(guò)交通事故影響因素分析,對(duì)事故進(jìn)行進(jìn)一步解析,并建立合理的模型理論和確定預(yù)測(cè)指標(biāo),對(duì)未來(lái)交通事故發(fā)展趨勢(shì)加以預(yù)測(cè)。該預(yù)測(cè)方法的適應(yīng)性較強(qiáng),在我國(guó)交通事故預(yù)測(cè)工作實(shí)踐中有著較為有效的運(yùn)用,可解決傳統(tǒng)預(yù)測(cè)方法難以解決的問(wèn)題,建立在BP網(wǎng)絡(luò)基礎(chǔ)之上,并利用計(jì)算機(jī)開(kāi)展輔計(jì)算活動(dòng)。
2.6 多層遞階預(yù)測(cè)方法
多層遞階預(yù)測(cè)方法能夠規(guī)避傳統(tǒng)統(tǒng)計(jì)預(yù)測(cè)方法的缺陷,以現(xiàn)代控制理論“系統(tǒng)辨識(shí)”為重要基礎(chǔ),對(duì)對(duì)象的未來(lái)狀態(tài)做科學(xué)的預(yù)測(cè)。動(dòng)態(tài)系統(tǒng)數(shù)學(xué)模型為:y(k)=。在交通事故預(yù)測(cè)中,多層遞階預(yù)測(cè)方法是大數(shù)據(jù)時(shí)代背景下的重要處理方式,有利于增強(qiáng)預(yù)測(cè)效果。
3 結(jié)論
交通部門(mén)對(duì)交通事故進(jìn)行合理的預(yù)測(cè),有利于提高道路交通系統(tǒng)的安全系數(shù)。所以,相關(guān)人員合理選擇交通事故預(yù)測(cè)方法具有必要性,為規(guī)避交通事故而做出科學(xué)合理的決策。目前,使用較多的交通事故預(yù)測(cè)方法主要有:回歸分析預(yù)測(cè)法、時(shí)間序列預(yù)測(cè)法、灰色馬爾科夫鏈預(yù)測(cè)法、貝葉斯預(yù)測(cè)法、灰關(guān)聯(lián)分析及神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法等,因其各具優(yōu)缺點(diǎn)和適用條件,因而要求相關(guān)人員必須對(duì)系列問(wèn)題進(jìn)行深入探究,確保公路交通事故預(yù)測(cè)的有效性。
參考文獻(xiàn)
[1]李景文,高桂清.交通事故預(yù)測(cè)分析[J].中國(guó)安全科學(xué)學(xué)報(bào),2015,6(01):20-23.
[2]劉志強(qiáng).道路交通事故預(yù)測(cè)方法比較研究[J].交通與計(jì)算機(jī),2013,19(05):7-10.
【中圖分類(lèi)號(hào)】G64 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2015)06-0155-02
大數(shù)據(jù),或稱(chēng)巨量資料,指的是需要新處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)[2]。大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)那些含有意義的數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化處理。本文將以東北地區(qū)數(shù)學(xué)專(zhuān)業(yè)教師大數(shù)據(jù)為基礎(chǔ),通過(guò)“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”,使其為決策與預(yù)測(cè)服務(wù)。
一、東北地區(qū)數(shù)學(xué)專(zhuān)業(yè)教師大數(shù)據(jù)來(lái)源及準(zhǔn)備
通過(guò)查閱資料與調(diào)查,收集到東北三省各高校數(shù)學(xué)教師相關(guān)大數(shù)據(jù),包括教師教齡(?S年)、收入(?S元)、稅收(?S元)和職業(yè)病情況等方面的實(shí)際數(shù)據(jù)。由于得到的數(shù)據(jù)信息量大,輕重各異,所以首先需要進(jìn)行數(shù)據(jù)預(yù)處理,即清除異常數(shù)據(jù)、錯(cuò)誤糾正、格式標(biāo)準(zhǔn)化等,再通過(guò)數(shù)據(jù)挖掘技術(shù),利用一系列相關(guān)算法和數(shù)據(jù)處理技術(shù)從大量的數(shù)據(jù)中提取人們所需要的重要信息,也就是上面所提到的實(shí)現(xiàn)信息的“增值”,同時(shí)大大提高數(shù)據(jù)處理效率,下面具體介紹本項(xiàng)目所采用的模型和計(jì)算方法。
二、東北地區(qū)數(shù)學(xué)專(zhuān)業(yè)教師大數(shù)據(jù)分析與結(jié)果
收集并處理好教師教齡、收入、稅收和職業(yè)病情況等方面的數(shù)據(jù)后,本文主要針對(duì)三個(gè)方面進(jìn)行了詳細(xì)的分析:
1.教師收入隨年份的變化
(1)數(shù)據(jù)范圍:1994年-2014年?yáng)|三省各高校數(shù)學(xué)教師收入(單位:元);
(2)計(jì)算條件:matlab軟件,最小二乘回歸分析,高性能計(jì)算工作站;
(3)求解過(guò)程:年份作為自變量x,收入為因變量y,從總體上看,二者統(tǒng)計(jì)關(guān)系大致符合一元線性的正態(tài)誤差模型[3],即對(duì)給定xi的有最小二乘一元線性回歸公式y(tǒng)i=b0+b1xi+εi,其中:
b■=■, ■=■■x■b0=■-b■■, ■ =■■y■
其中εi是由變量可能的內(nèi)在隨機(jī)性、未知影響因素等隨機(jī)擾動(dòng)造成的誤差??傊?,它可看成是眾多細(xì)小影響因素的綜合代表。最后,由Matlab提供polyfit函數(shù)實(shí)現(xiàn)回歸函數(shù)擬合[4];
(4)結(jié)果分析:計(jì)算結(jié)果表明,隨著年份的增加,教師收入也在不斷增加。估計(jì)的因變量的系數(shù)b1約為191,也就是說(shuō),每過(guò)一年,教師收入大致可增加近191元。
2.教師職業(yè)病情況與教齡的關(guān)系
(1)數(shù)據(jù)范圍:1994年―2014年?yáng)|三省各高校數(shù)學(xué)教師教齡(單位:年)、職業(yè)病情況;
(2)結(jié)果分析:首先利用matlab軟件,以橫軸為某年?yáng)|三省數(shù)學(xué)教師教齡,縱軸反映相應(yīng)教齡的平均職業(yè)病情況(為方便,規(guī)定越接近縱軸正方向,職業(yè)病越嚴(yán)重)利用matlab軟件繪制圖形[5],發(fā)現(xiàn)教師教齡越長(zhǎng),職業(yè)病也愈加嚴(yán)重。每一年的教師職業(yè)病情況均可繪制一張圖表,通過(guò)將這11張圖表的最高值(即每一年職業(yè)病的最高值)做比較,發(fā)現(xiàn)其趨勢(shì)是先逐年下降,最后趨于穩(wěn)定。
3.對(duì)教師專(zhuān)業(yè)發(fā)展階段的研究
(1)數(shù)據(jù)范圍:2014年?yáng)|三省各高校數(shù)學(xué)教師收入、教齡、稅收和職業(yè)病大數(shù)據(jù);
(2)計(jì)算條件:IBM處理器、大數(shù)據(jù)挖掘分類(lèi)算法;
(3)求解過(guò)程:用神經(jīng)網(wǎng)絡(luò)研究方法(即模擬生物上神經(jīng)元工作的方法)。圖中每個(gè)橢圓形節(jié)點(diǎn)接受輸入數(shù)據(jù),將數(shù)據(jù)處理后輸出,輸入層節(jié)點(diǎn)接受教師信息的輸入,然后將數(shù)據(jù)傳遞給隱藏層,隱藏層將數(shù)據(jù)傳給輸出層,輸出層輸出教師專(zhuān)業(yè)發(fā)展處于哪一專(zhuān)業(yè)成熟階段;
(4)結(jié)果分析:若將教師專(zhuān)業(yè)成熟過(guò)程分為三個(gè)階段:形成期、發(fā)展期和成熟期。那么利用IBM處理器和以上算法,在所調(diào)查的教師中,約70%處于發(fā)展時(shí)期,是其基本適應(yīng)教育教學(xué)工作的時(shí)期;約20%處于形成期,是形成良好心理素質(zhì)和正確教育思想的關(guān)鍵時(shí)期;約10%處于成熟期,是掌握教學(xué)主動(dòng)權(quán),成為學(xué)校教學(xué)骨干的時(shí)期;
(5)研究意義:研究東三省高校數(shù)學(xué)教師專(zhuān)業(yè)發(fā)展成熟階段,可以基本掌握教師資源結(jié)構(gòu),從而能夠遵循不同發(fā)展階段的不同特征、觀念、心理、發(fā)展需求,制定相應(yīng)教研活動(dòng)、政策和制度,促進(jìn)教師全面持續(xù)發(fā)展[6]。
三、結(jié)果討論
1.數(shù)據(jù)呈現(xiàn)以上結(jié)果的原因
(1)隨著國(guó)家科教興國(guó)戰(zhàn)略的深入實(shí)施,教師的工資和待遇將被逐步納入國(guó)家工作人員統(tǒng)一管理,教師的收入將得到很大的提高。另一方面,數(shù)學(xué)能力的培養(yǎng)是學(xué)習(xí)各專(zhuān)業(yè)、走入各行業(yè)的基礎(chǔ),國(guó)家將加大數(shù)學(xué)知識(shí)的教育力度,進(jìn)而數(shù)學(xué)專(zhuān)業(yè)教師所付出的辛苦也更加不可小覷,綜合以上幾個(gè)重要原因,教師收入隨年份增加而增加也是符合經(jīng)濟(jì)理論的。
(2)教齡越長(zhǎng),職業(yè)病也越嚴(yán)重的依存關(guān)系,我們?nèi)菀桌斫?。但隨著時(shí)間的推移,職業(yè)病的嚴(yán)重性呈現(xiàn)下降趨勢(shì)正是反映了我國(guó)科技的革新:環(huán)境的改變、教學(xué)設(shè)備和教學(xué)技術(shù)的更新使得教師的課堂教學(xué)更加高效和輕松便捷,如多媒體、電子白板使得課堂不再“塵土飛揚(yáng)”。
(3)在對(duì)教師專(zhuān)業(yè)發(fā)展階段的研究中,處于專(zhuān)業(yè)發(fā)展時(shí)期的教師所占比例最高,達(dá)到近70%。實(shí)際上,他們多數(shù)處于青壯年的人生階段,是社會(huì)的中堅(jiān)力量,又曾在高等教育多樣化與綜合化的背景下受到過(guò)良好的教育,并具有較豐富的教學(xué)經(jīng)驗(yàn)和緊跟新時(shí)代的創(chuàng)新思想,自然在專(zhuān)業(yè)發(fā)展的角度也占有較大比例。
2.合理的相關(guān)預(yù)測(cè)
大數(shù)據(jù)最有價(jià)值的特點(diǎn)就是其“預(yù)見(jiàn)性”。上述數(shù)值結(jié)果表明,在經(jīng)濟(jì)平穩(wěn)發(fā)展和社會(huì)穩(wěn)定的前提下,東三省數(shù)學(xué)專(zhuān)業(yè)教師的收入在未來(lái)的幾十年依舊處于增長(zhǎng)趨勢(shì),教師職業(yè)病總體減輕,專(zhuān)業(yè)發(fā)展越來(lái)越成熟,使得教師隊(duì)伍整體素質(zhì)越來(lái)越高,而未來(lái)教師的考核獎(jiǎng)勵(lì)制度也會(huì)變得更加嚴(yán)格和全面。
3.建議
(1)無(wú)論是對(duì)教師行業(yè)還是其他行業(yè)感興趣,都要關(guān)注其變化,分析其形勢(shì)及趨勢(shì),以便對(duì)此行業(yè)的認(rèn)知更加科學(xué)合理。
(2)本文采用的大數(shù)據(jù)處理所用模型和方法,可以進(jìn)一步推廣到其它相關(guān)領(lǐng)域,使之成為研究大數(shù)據(jù)的更通用的工具。
本文利用matlab軟件、最小二乘法模型及IBM處理器分析了東北地區(qū)數(shù)學(xué)專(zhuān)業(yè)教師大數(shù)據(jù),得出的結(jié)果對(duì)于掌握該地區(qū)數(shù)學(xué)教師基本情況并預(yù)測(cè)其發(fā)展趨勢(shì)有著重要的作用,還為熱心同類(lèi)問(wèn)題的研究者提供高效的方法和技術(shù)。當(dāng)我們不能有效處理所獲取的大數(shù)據(jù),它們就是一些平凡的數(shù)字和符號(hào)。如果我們能夠很好地駕馭大數(shù)據(jù),它們必定會(huì)為我們帶來(lái)諸多的方便。
最小二乘法模型在處理大數(shù)據(jù)時(shí)有一定的優(yōu)勢(shì)[7],統(tǒng)計(jì)分析,神經(jīng)網(wǎng)絡(luò)算法和遺傳算法都是處理大數(shù)據(jù)的有效方法,如果能將這些方法有機(jī)的結(jié)合起來(lái),將更能獲得許多滿(mǎn)意的數(shù)值分析結(jié)果。當(dāng)大數(shù)據(jù)超過(guò)計(jì)算條件的時(shí)空允許時(shí),不僅耗時(shí)費(fèi)力,甚至使得計(jì)算成為不可能,通常需要采用并行算法等高效計(jì)算手段。在高性能計(jì)算方面,我們并沒(méi)有用到并行算法,如果能利用并行算法,所處理的數(shù)值結(jié)果容量會(huì)更大更有參考價(jià)值。
參考文獻(xiàn):
[1]蔡鎖章主編.數(shù)學(xué)建模:原理與方法.北京:海洋出版社,2000.
[2]維克托邁爾舍恩伯格.大數(shù)據(jù)時(shí)代.浙江:浙江人民出版社,2012.
[3]吳翊,吳孟達(dá),成禮智編著.數(shù)學(xué)建模的理論與實(shí)踐.長(zhǎng)沙:國(guó)防科技大學(xué)出版社,1999.
[4]張德豐編著.Matlab數(shù)值分析與仿真案例.北京:清華大學(xué)出版社,2011.10(21世紀(jì)高等學(xué)校規(guī)劃教材計(jì)算機(jī)應(yīng)用)IBSN 978―7―302―26254―1.