在日常的學(xué)習(xí)、工作、生活中,肯定對各類范文都很熟悉吧。那么我們該如何寫一篇較為完美的范文呢?下面是小編為大家收集的優(yōu)秀范文,供大家參考借鑒,希望可以幫助到有需要的朋友。
的論文論文大概幾頁a紙篇一
編寫畢業(yè)論文提綱有兩種方法,標(biāo)題式寫法。即用簡要的文字寫成標(biāo)題,把這部分的內(nèi)容概括出來。這種寫法簡明扼要,一目了然, 詳細(xì)內(nèi)容請看下文。
只有作者自己明白。畢業(yè)論文提綱一般不能采用這種方法編寫.二是句子式寫法。即以一個能表達(dá)完整意思的句子形式把該部分內(nèi)容概括出來。這種寫法具體而明確,別人看了也能明了,但費(fèi)時費(fèi)力。
提綱寫好后,還有一項很重要的工作不可疏忽,這就是提綱的推敲和修改,這種推敲和修改要把握如下幾點(diǎn)。
一是推敲題目是否恰當(dāng),是否合適;
二是推敲提綱的結(jié)構(gòu)。先圍繞所要闡述的中心論點(diǎn)或者說明的主要議題,檢查劃分的部分、層次和段落是否可以充分說明問題,是否合乎道理;各層次、段落之間的聯(lián)系是否緊密,過渡是否自然。然后再進(jìn)行客觀總體布局的檢查,再對每一層次中的論述秩序進(jìn)行“微調(diào)”。
的論文論文大概幾頁a紙篇二
其實(shí)本科生畢業(yè)論文對內(nèi)容要求并不高。畢業(yè)設(shè)計不是去研究一個新東西或者一個新課題,而是用大學(xué)四年學(xué)到的知識去完成一個工作或者一個項目。它屬于應(yīng)用型論文。既然是應(yīng)用型論文,本科畢業(yè)論文的題目往往都是很多年前就有的,而且是很常見的。所以論文資料從各種途徑獲得是必然的,格式也是多樣的。
應(yīng)用型論文就注定了這種論文對格式的要求特別突出。所以就本科的畢業(yè)論文來說,格式是重中之重,必須認(rèn)真對待。在獲取論文資料時,最常見的莫過于網(wǎng)絡(luò),網(wǎng)絡(luò)上能搜索到很多有用的資料供編寫論文使用,這也節(jié)省了大量工作,但是需要注意的是網(wǎng)上資料的格式也是五花八門的,需要統(tǒng)一的整理和規(guī)范化。一個格式規(guī)范的畢業(yè)論文,答辯通過率大大超過格式不規(guī)范的畢業(yè)論文。
每個學(xué)校都有論文格式要求,但是大致都是一樣的,都是參照國家論文標(biāo)準(zhǔn)制定的。東昌學(xué)院也有專門的論文模板文件:“本科畢業(yè)論文(設(shè)計)參考模板”。
在模板上有非常詳細(xì)的格式要求,在這里不再做敘述,只指出一種格式的修改技巧,能讓論文規(guī)范化事半功倍。這是以論文內(nèi)容必須充實(shí)為前提的。在內(nèi)容達(dá)標(biāo)之后開始對整篇論文進(jìn)行“八步格式化”。
第一步:新建一個空白 word 文檔,按論文要求設(shè)置頁邊距和裝訂線距離。并選中“應(yīng)用于整篇文章”點(diǎn)“確定”。
第二步,把編輯好的論文封面復(fù)制到空白文檔內(nèi),并在結(jié)尾處插入“分節(jié)符——下一頁”。注意:論文封面必須嚴(yán)格按照模板格式(最好直接在模板上修改)。
第三步,在分節(jié)符后面的新頁上生成目錄:“插入”——“引用”——“索引和目錄”選擇“目錄”選項卡,一般只選擇生成到3級標(biāo)題。點(diǎn)確定就可自動生成目錄,然后再次插入“分節(jié)符——下一頁”。
這時候生成的目錄還是空白。
第四步,把中文摘要和英文摘要復(fù)制到分節(jié)符后面的新頁上。修改好字體字號和段間距,并在摘要后面再次插入“分節(jié)符——下一頁”。
第五步,把論文正文粘貼到后面的新頁內(nèi),包括結(jié)語、參考文獻(xiàn)和致謝部分。
第六步,添加頁眉頁腳?!耙晥D”——“頁眉和頁腳”在里面輸入指定內(nèi)容設(shè)置好字體即可。需要注意的是,在每一個分節(jié)符后面頁眉和頁腳都可以重新設(shè)置。也就是說,在同一篇文章里允許設(shè)置不同的頁眉和頁腳內(nèi)容和格式。比如有的學(xué)校要求摘要部分的頁碼要用羅馬數(shù)字,而正文部分用阿拉伯?dāng)?shù)字;還有的要求每個章節(jié)的頁眉都是必須是章節(jié)名,等等都可以用插入“分節(jié)符——下一頁”的辦法實(shí)現(xiàn)。
的論文論文大概幾頁a紙篇三
題目:數(shù)據(jù)挖掘技術(shù)在神經(jīng)根型頸椎病方劑研究中的優(yōu)勢及應(yīng)用進(jìn)展
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù); 神經(jīng)根型頸椎病; 方劑; 綜述;
數(shù)據(jù)挖掘技術(shù)[1] (knowledge discovery in datebase, kkd) , 是一種新興的信息處理技術(shù), 它融匯了人工智能、模式別、模糊數(shù)學(xué)、數(shù)據(jù)庫、數(shù)理統(tǒng)計等多種技術(shù)方法, 專門用于海量數(shù)據(jù)的處理, 從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)集中, 提取隱含在其中的、人們事先不知道的、但又是潛在的有用的信息和知識, 其目的是發(fā)現(xiàn)規(guī)律而不是驗證假設(shè)。數(shù)據(jù)挖掘技術(shù)主要適用于龐大的數(shù)據(jù)庫的研究, 其特點(diǎn)在于:基于數(shù)據(jù)分析方法角度的分類, 其本質(zhì)屬于觀察性研究, 數(shù)據(jù)來源于日常診療工作資料, 應(yīng)用的技術(shù)較傳統(tǒng)研究更先進(jìn), 分析工具、理論模型與傳統(tǒng)研究區(qū)別較大。其操作步驟包括[2]:選擇數(shù)據(jù), 數(shù)據(jù)處理, 挖掘分析, 結(jié)果解釋, 其中結(jié)果解釋是數(shù)據(jù)挖掘技術(shù)研究的關(guān)鍵。其方法包括分類、聚類、關(guān)聯(lián)、序列、決策樹、貝斯網(wǎng)絡(luò)、因子、辨別等分析[3], 其結(jié)果通常表示為概念、規(guī)則、規(guī)律、模式、約束、可視化等形式圖[4]。當(dāng)今數(shù)據(jù)挖掘技術(shù)的方向主要在于:特定數(shù)據(jù)挖掘, 高效挖掘算法, 提高結(jié)果的有效性、確定性和表達(dá)性, 結(jié)果的可視化, 多抽象層上的交互式數(shù)據(jù)挖掘, 多元數(shù)據(jù)挖掘及數(shù)據(jù)的安全性和保密性。因其優(yōu)勢和獨(dú)特性被運(yùn)用于多個領(lǐng)域中, 且結(jié)果運(yùn)用后取得顯著成效, 因此越來越多的中醫(yī)方劑研究者將其運(yùn)用于方劑中藥物的研究。
中醫(yī)對于神經(jīng)根型頸椎病的治療準(zhǔn)則為辨證論治, 從古至今神經(jīng)根型頸椎病的中醫(yī)證型有很多, 其治方是集中醫(yī)之理、法、方、藥為一體的數(shù)據(jù)集合, 具有以“方-藥-證”為核心的多維結(jié)構(gòu)。方劑配伍本質(zhì)上表現(xiàn)為方與方、方與藥、藥與藥、藥與劑量, 以及方藥與證、病、癥交叉錯綜的關(guān)聯(lián)與對應(yīng)[5], 而中醫(yī)方劑講究君臣佐使的配伍, 藥物有升降沉浮, 四氣五味及歸經(jīng)之別, 對于神經(jīng)根型頸椎病的治療, 治方中藥物的種類、炮制方法、用量、用法等都是千變?nèi)f化的, 而這些海量、模糊、看似隨機(jī)的藥物背后隱藏著對臨床有用的信息和規(guī)律, 但這些大數(shù)據(jù)是無法在可承受的時間范圍內(nèi)可用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的, 是需要一個新處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力, 而數(shù)據(jù)挖掘技術(shù)有可能從這些海量的的數(shù)據(jù)中發(fā)現(xiàn)新知識, 揭示背后隱藏的關(guān)系和規(guī)則, 并且對未知的情況進(jìn)行預(yù)測[6]。再者, 中醫(yī)辨治充滿非線性思維, “方-藥-證”間的多層關(guān)聯(lián)、序列組合、集群對應(yīng), 形成了整體論的思維方式和原則, 而數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘在技術(shù)線路上與傳統(tǒng)數(shù)據(jù)處理方法不同在于其能對數(shù)據(jù)庫內(nèi)的數(shù)據(jù)以線性和非線性方式解析, 尤善處理模糊的、非量化的數(shù)據(jù)。例如趙睿曦等[7]在研究張氏骨傷治療腰椎間盤突出癥的用藥規(guī)律時, 選取了100張治方, 因該病病因病機(jī)復(fù)雜, 證候不一, 骨傷名師張玉柱先生對該病的治則治法、藥物使用是不同的。因此他們利用excel建立方證數(shù)據(jù)庫, 采用spps clementine12.0軟件對這些數(shù)據(jù)的用藥頻次、藥物關(guān)聯(lián)規(guī)則及藥物聚類進(jìn)行分析, 最后總結(jié)出張氏骨傷治療腰椎間盤突出癥遵循病從肝治、病從血治、標(biāo)本兼治的原則, 也歸納出治療三種不同證型的腰突癥的三類自擬方。由此看出數(shù)據(jù)挖掘技術(shù)在方劑研究中的應(yīng)用對數(shù)據(jù)背后信息、規(guī)律等的挖掘及名家經(jīng)驗的推廣具有重大意義, 因此數(shù)據(jù)挖掘技術(shù)在神經(jīng)根型頸椎病的治方研究中也同樣發(fā)揮著巨大的作用。
神經(jīng)根型頸椎病在所有頸椎病中最常見, 約占50%~60%[8], 醫(yī)家對其治方的研究也是不計其數(shù)。近年來數(shù)據(jù)挖掘技術(shù)也被運(yùn)用于其治方研究中, 筆者通過萬方、中國知網(wǎng)等總共檢索出以下幾篇文獻(xiàn), 雖數(shù)量不多但其優(yōu)勢明顯。劉向前等[9]在挖掘古方治療神經(jīng)根型頸椎病的用藥規(guī)律時, 通過檢索《中華醫(yī)典》并從中篩選以治療頸項肩臂痛為主的古方219首并建立數(shù)據(jù)庫, 對不同證治古方的用藥類別、總味數(shù)、單味藥使用頻數(shù)及藥對 (組) 出現(xiàn)頻數(shù)進(jìn)行統(tǒng)計, 總結(jié)出風(fēng)寒濕痹證、痰濕阻痹證、寒濕阻滯證、正虛不足證的用藥特點(diǎn), 得出解表藥、祛風(fēng)濕藥、活血化瘀藥、補(bǔ)虛藥是治療頸項肩臂痛古方組成的主要藥物。古為今用, 該研究對于現(xiàn)代醫(yī)家在治療該病中有很好的借鑒和參考意義。齊兵獻(xiàn)等[10]檢索cnki (1980-2009年) 相關(guān)文獻(xiàn)中治療神經(jīng)根型頸椎病的方劑建立數(shù)據(jù)庫, 采用spss11.5統(tǒng)計軟件這些治方常用藥物使用頻次頻率、性味頻率、歸經(jīng)頻率分析比較, 治療神經(jīng)根型頸椎病的中藥共計99味, 使用頻次479味次;所用藥物種類依次以補(bǔ)益藥、活血化瘀藥、祛風(fēng)濕藥運(yùn)用最多, 其中藥味以辛、苦為主, 藥性以溫、寒為主, 歸經(jīng)以肝、脾、心為主, 而本病以肝腎虧虛, 氣血瘀滯為主, 臨床以補(bǔ)益藥、活血化瘀藥、祛風(fēng)濕藥等中藥運(yùn)用最多。這對于醫(yī)家治療該病選用藥物的性味、歸經(jīng)等具有指導(dǎo)意義。陳元川等[11]檢索2004年1月至2013年3月發(fā)表的以單純口服中藥治療神經(jīng)根型頸椎病的有關(guān)文獻(xiàn), 對其中的方劑和藥物進(jìn)行統(tǒng)計、歸類、分析, 最終納入32首方劑, 涉及111味中藥, 補(bǔ)氣藥、發(fā)散風(fēng)寒藥、活血止痛藥、補(bǔ)血藥等使用頻次較高;葛根、白芍、黃芪、當(dāng)歸、桂枝等藥物使用頻次較高, 證實(shí)與古方桂枝加葛根湯主藥相同, 且該方扶陽解表的治法與該研究得出的扶正祛邪的結(jié)果相吻合, 同時也證實(shí)石氏傷科強(qiáng)調(diào)治傷科病當(dāng)“以氣為主, 以血為先”等正確性。所以大數(shù)據(jù)背后的規(guī)律和關(guān)系在很多方面古今是一致的, 同時數(shù)據(jù)依據(jù)的支持也為現(xiàn)代神經(jīng)根型頸椎病治療提供有力的保障。謝輝等[12]收集2009至2014年10月3日的166張治療神經(jīng)根型頸椎病的治方建立數(shù)據(jù)庫, 采用關(guān)聯(lián)規(guī)則算法、復(fù)雜系統(tǒng)熵聚類等無監(jiān)督數(shù)據(jù)挖掘方法, 利用中醫(yī)傳承輔助平臺 (tcmiss) 軟件分析處方中各種藥物的使用頻次、藥物之間的關(guān)聯(lián)規(guī)則、核心藥物組合和新處方, 從中挖掘出治療該病中醫(yī)中的常用藥物、藥對, 闡明了治療該病以解肌散寒藥、補(bǔ)氣活血藥、祛風(fēng)勝濕藥和溫經(jīng)通絡(luò)藥為主, 治法主要包括解肌舒筋、益氣活血和補(bǔ)益肝腎, 這一方面很清晰明了地展示了藥物使用頻率、藥物之間的聯(lián)系, 證實(shí)其與很多古代經(jīng)典中治療神經(jīng)根型頸椎病的治則、治法及用藥規(guī)律是吻合的, 是臨床用藥的積累和升華, 可有效地指導(dǎo)臨床并提高療效;另一方面也為中藥新藥的創(chuàng)制提供處方來源, 指導(dǎo)新藥研發(fā)[13]。
數(shù)據(jù)挖掘技術(shù)作為一種新型的研究技術(shù), 在神經(jīng)根型頸椎病的治方研究中的運(yùn)用相對于其他領(lǐng)域是偏少的, 并且基本上是研究文獻(xiàn)資料上出現(xiàn)的治方, 在對名老中醫(yī)個人治療經(jīng)驗及用藥規(guī)律的總結(jié)是缺乏的, 因此研究范圍廣而缺乏針對性, 同時使用該技術(shù)的相關(guān)軟件種類往往是單一的?,F(xiàn)在研究者在研究中醫(yī)方劑時往往采用傳統(tǒng)的研究方法, 這就導(dǎo)致在大數(shù)據(jù)的研究中耗時、耗力甚則無能為力, 同樣也難以精準(zhǔn)地提取大數(shù)據(jù)背后的隱藏的潛在關(guān)系和規(guī)則及缺乏對未知情況的預(yù)測。產(chǎn)生這樣的現(xiàn)狀, 一方面是很多研究者尚未清楚該技術(shù)在方劑研究中的優(yōu)勢所在, 思維模式尚未更新;另一方面是很多研究者尚未清楚該技術(shù)的操作技能及軟件種類及其應(yīng)用范圍。故以后應(yīng)向更多研究者普及該技術(shù)的軟件種類、其中的優(yōu)勢及操作技能, 讓該技術(shù)在臨床中使用更廣, 產(chǎn)生更大的效益。
參考文獻(xiàn)
摘要:大數(shù)據(jù)和智游都是當(dāng)下的熱點(diǎn), 沒有大數(shù)據(jù)的智游無從談“智慧”, 數(shù)據(jù)挖掘是大數(shù)據(jù)應(yīng)用于智游的核心, 文章探究了在智游應(yīng)用中, 目前大數(shù)據(jù)挖掘存在的幾個問題。
隨著人民生活水平的進(jìn)一步提高, 旅游消費(fèi)的需求進(jìn)一步上升, 在云計算、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及移動智能終端等信息通訊技術(shù)的飛速發(fā)展下, 智游應(yīng)運(yùn)而生。大數(shù)據(jù)作為當(dāng)下的熱點(diǎn)已經(jīng)成了智游發(fā)展的有力支撐, 沒有大數(shù)據(jù)提供的有利信息, 智游無法變得“智慧”。
旅游業(yè)是信息密、綜合性強(qiáng)、信息依存度高的產(chǎn)業(yè)[1], 這讓其與大數(shù)據(jù)自然產(chǎn)生了交匯。2010年, 江蘇省鎮(zhèn)江市首先提出“智游”的概念, 雖然至今國內(nèi)外對于智游還沒有一個統(tǒng)一的學(xué)術(shù)定義, 但在與大數(shù)據(jù)相關(guān)的描述中, 有學(xué)者從大數(shù)據(jù)挖掘在智游中的作用出發(fā), 把智游描述為:通過充分收集和管理所有類型和來源的旅游數(shù)據(jù), 并深入挖掘這些數(shù)據(jù)的潛在重要價值信息, 然后利用這些信息為相關(guān)部門或?qū)ο筇峁┓?wù)[2]。這一定義充分肯定了在發(fā)展智游中, 大數(shù)據(jù)挖掘所起的至關(guān)重要的作用, 指出了在智游的過程中, 數(shù)據(jù)的收集、儲存、管理都是為數(shù)據(jù)挖掘服務(wù), 智游最終所需要的是利用挖掘所得的有用信息。
2011年, 我國提出用十年時間基本實(shí)現(xiàn)智游的目標(biāo)[3], 過去幾年, 國家旅游局的相關(guān)動作均為了實(shí)現(xiàn)這一目標(biāo)。但是, 在借助大數(shù)據(jù)推動智游的可持續(xù)性發(fā)展中, 大數(shù)據(jù)所產(chǎn)生的價值卻亟待提高, 原因之一就是在收集、儲存了大量數(shù)據(jù)后, 對它們深入挖掘不夠, 沒有發(fā)掘出數(shù)據(jù)更多的價值。
智游的發(fā)展離不開移動網(wǎng)絡(luò)、物聯(lián)網(wǎng)、云平臺。隨著大數(shù)據(jù)的不斷發(fā)展, 國內(nèi)許多景區(qū)已經(jīng)實(shí)現(xiàn)wi-fi覆蓋, 部分景區(qū)也已實(shí)現(xiàn)人與人、人與物、人與景點(diǎn)之間的實(shí)時互動, 多省市已建有旅游產(chǎn)業(yè)監(jiān)測平臺或旅游大數(shù)據(jù)中心以及數(shù)據(jù)可視化平臺, 從中進(jìn)行數(shù)據(jù)統(tǒng)計、行為分析、監(jiān)控預(yù)警、服務(wù)質(zhì)量監(jiān)督等。通過這些平臺, 已基本能掌握跟游客和景點(diǎn)相關(guān)的數(shù)據(jù), 可以實(shí)現(xiàn)更好旅游監(jiān)控、產(chǎn)業(yè)宏觀監(jiān)控, 對該地的旅游管理和推廣都能發(fā)揮重要作用。
但從智慧化的發(fā)展來看, 我國的信息化建設(shè)還需加強(qiáng)。雖然通訊網(wǎng)絡(luò)已基本能保證, 但是大部分景區(qū)還無法實(shí)現(xiàn)對景區(qū)全面、透徹、及時的感知, 更為困難的是對平臺的建設(shè)。在數(shù)據(jù)共享平臺的建設(shè)上, 除了必備的硬件設(shè)施, 大數(shù)據(jù)實(shí)驗平臺還涉及大量部門, 如政府管理部門、氣象部門、交通、電子商務(wù)、旅行社、旅游網(wǎng)站等。如此多的部門相關(guān)聯(lián), 要想建立一個完整全面的大數(shù)據(jù)實(shí)驗平臺, 難度可想而知。
大數(shù)據(jù)時代缺的不是數(shù)據(jù), 而是方法。大數(shù)據(jù)在旅游行業(yè)的應(yīng)用前景非常廣闊, 但是面對大量的數(shù)據(jù), 不懂如何收集有用的數(shù)據(jù)、不懂如何對數(shù)據(jù)進(jìn)行挖掘和利用, 那么“大數(shù)據(jù)”猶如礦山之中的廢石。旅游行業(yè)所涉及的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù), 通過云計算技術(shù), 對數(shù)據(jù)的收集、存儲都較為容易, 但對數(shù)據(jù)的挖掘分析則還在不斷探索中。大數(shù)據(jù)的挖掘常用的方法有關(guān)聯(lián)分析, 相似度分析, 距離分析, 聚類分析等等, 這些方法從不同的角度對數(shù)據(jù)進(jìn)行挖掘。其中, 相關(guān)性分析方法通過關(guān)聯(lián)多個數(shù)據(jù)來源, 挖掘數(shù)據(jù)價值。但針對旅游數(shù)據(jù), 采用這些方法挖掘數(shù)據(jù)的價值信息, 難度也很大, 因為旅游數(shù)據(jù)中冗余數(shù)據(jù)很多, 數(shù)據(jù)存在形式很復(fù)雜。在旅游非結(jié)構(gòu)化數(shù)據(jù)中, 一張圖片、一個天氣變化、一次輿情評價等都將會對游客的旅行計劃帶來影響。對這些數(shù)據(jù)完全挖掘分析, 對游客“行前、行中、行后”大數(shù)據(jù)的實(shí)時性挖掘都是很大的挑戰(zhàn)。
2017年, 數(shù)據(jù)安全事件屢見不鮮, 伴著大數(shù)據(jù)而來的數(shù)據(jù)安全問題日益凸顯出來。在大數(shù)據(jù)時代, 無處不在的數(shù)據(jù)收集技術(shù)使我們的個人信息在所關(guān)聯(lián)的數(shù)據(jù)中心留下痕跡, 如何保證這些信息被合法合理使用, 讓數(shù)據(jù)“可用不可見”[4], 這是亟待解決的問題。同時, 在大數(shù)據(jù)資源的開放性和共享性下, 個人隱私和公民權(quán)益受到嚴(yán)重威脅。這一矛盾的存在使數(shù)據(jù)共享程度與數(shù)據(jù)挖掘程度成反比。此外, 經(jīng)過大數(shù)據(jù)技術(shù)的分析、挖掘, 個人隱私更易被發(fā)現(xiàn)和暴露, 從而可能引發(fā)一系列社會問題。
大數(shù)據(jù)背景下的旅游數(shù)據(jù)當(dāng)然也避免不了數(shù)據(jù)的安全問題。如果游客“吃、住、行、游、娛、購”的數(shù)據(jù)被放入數(shù)據(jù)庫, 被完全共享、挖掘、分析, 那游客的人身財產(chǎn)安全將會受到嚴(yán)重影響, 最終降低旅游體驗。所以, 數(shù)據(jù)的安全管理是進(jìn)行大數(shù)據(jù)挖掘的前提。
大數(shù)據(jù)背景下的智游離不開人才的創(chuàng)新活動及技術(shù)支持, 然而與專業(yè)相銜接的大數(shù)據(jù)人才培養(yǎng)未能及時跟上行業(yè)需求, 加之創(chuàng)新型人才的外流, 以及數(shù)據(jù)統(tǒng)計未來3~5年大數(shù)據(jù)行業(yè)將面臨全球性的人才荒, 國內(nèi)智游的構(gòu)建還缺乏大量人才。
在信息化建設(shè)上, 加大政府投入, 加強(qiáng)基礎(chǔ)設(shè)施建設(shè), 整合結(jié)構(gòu)化數(shù)據(jù), 抓取非結(jié)構(gòu)化數(shù)據(jù), 打通各數(shù)據(jù)壁壘, 建設(shè)旅游大數(shù)據(jù)實(shí)驗平臺;在挖掘方法上, 對旅游大數(shù)據(jù)實(shí)時性數(shù)據(jù)的挖掘應(yīng)該被放在重要位置;在數(shù)據(jù)安全上, 從加強(qiáng)大數(shù)據(jù)安全立法、監(jiān)管執(zhí)法及強(qiáng)化技術(shù)手段建設(shè)等幾個方面著手, 提升大數(shù)據(jù)環(huán)境下數(shù)據(jù)安全保護(hù)水平。加強(qiáng)人才的培養(yǎng)與引進(jìn), 加強(qiáng)產(chǎn)學(xué)研合作, 培養(yǎng)智游大數(shù)據(jù)人才。
參考文獻(xiàn)
摘要:伴隨著計算機(jī)技術(shù)的不斷進(jìn)步和發(fā)展, 數(shù)據(jù)挖掘技術(shù)成為數(shù)據(jù)處理工作中的重點(diǎn)技術(shù), 能借助相關(guān)算法搜索相關(guān)信息, 在節(jié)省人力資本的同時, 提高數(shù)據(jù)檢索的實(shí)際效率, 基于此, 被廣泛應(yīng)用在數(shù)據(jù)密集型行業(yè)中。筆者簡要分析了計算機(jī)數(shù)據(jù)挖掘技術(shù), 并集中闡釋了檔案信息管理系統(tǒng)計算機(jī)數(shù)據(jù)倉庫的建立和技術(shù)實(shí)現(xiàn)過程, 以供參考。
數(shù)據(jù)挖掘技術(shù)就是指在大量隨機(jī)數(shù)據(jù)中提取隱含信息, 并且將其整合后應(yīng)用在知識處理體系的技術(shù)過程。若是從技術(shù)層面判定數(shù)據(jù)挖掘技術(shù), 則需要將其劃分在商業(yè)數(shù)據(jù)處理技術(shù)中, 整合商業(yè)數(shù)據(jù)提取和轉(zhuǎn)化機(jī)制, 并且建構(gòu)更加系統(tǒng)化的分析模型和處理機(jī)制, 從根本上優(yōu)化商業(yè)決策。借助數(shù)據(jù)挖掘技術(shù)能建構(gòu)完整的數(shù)據(jù)倉庫, 滿足集成性、時變性以及非易失性等需求, 整和數(shù)據(jù)處理和冗余參數(shù), 確保技術(shù)框架結(jié)構(gòu)的完整性。
目前, 數(shù)據(jù)挖掘技術(shù)常用的工具, 如sas企業(yè)的enterprise miner、ibm企業(yè)的intellient miner以及spss企業(yè)的clementine等應(yīng)用都十分廣泛。企業(yè)在實(shí)際工作過程中, 往往會利用數(shù)據(jù)源和數(shù)據(jù)預(yù)處理工具進(jìn)行數(shù)據(jù)定型和更新管理, 并且應(yīng)用聚類分析模塊、決策樹分析模塊以及關(guān)聯(lián)分析算法等, 借助數(shù)據(jù)挖掘技術(shù)對相關(guān)數(shù)據(jù)進(jìn)行處理。
為了充分發(fā)揮檔案信息管理系統(tǒng)的優(yōu)勢, 要結(jié)合客戶的實(shí)際需求建立完整的處理框架體系。在數(shù)據(jù)庫體系建立中, 要適應(yīng)迭代式處理特征, 并且從用戶需求出發(fā)整合數(shù)據(jù)模型, 保證其建立過程能按照整體規(guī)劃有序進(jìn)行, 且能按照目標(biāo)和分析框架參數(shù)完成操作。首先, 要確立基礎(chǔ)性的數(shù)據(jù)倉庫對象, 由于是檔案信息管理, 因此, 要集中劃分檔案數(shù)據(jù)分析的主題, 并且有效錄入檔案信息, 確保滿足檔案的數(shù)據(jù)分析需求。其次, 要對日常工作中的用戶數(shù)據(jù)進(jìn)行集中的挖掘處理, 從根本上提高數(shù)據(jù)倉庫分析的完整性。
(1) 確定數(shù)據(jù)倉庫的基礎(chǔ)性用戶, 其中, 主要包括檔案工作人員和使用人員, 結(jié)合不同人員的工作需求建立相應(yīng)的數(shù)據(jù)倉庫。
(2) 檔案工作要利用數(shù)據(jù)分析和檔案用戶特征分析進(jìn)行分類描述。
(3) 確定檔案的基礎(chǔ)性分類主題, 一般而言, 要將文書檔案歸檔情況、卷數(shù)等基礎(chǔ)性信息作為分類依據(jù)。
在設(shè)計過程中, 要針對不同維度建立相應(yīng)的參數(shù)體系和組成結(jié)構(gòu), 并且有效整合組成事實(shí)表的主鍵項目, 建立框架結(jié)構(gòu)。
第一, 建立事實(shí)表。事實(shí)表是數(shù)據(jù)模型的核心單元, 主要是記錄相關(guān)業(yè)務(wù)和統(tǒng)計數(shù)據(jù)的表, 能整合數(shù)據(jù)倉庫中的信息單元, 并且提升多維空間處理效果, 確保數(shù)據(jù)儲存過程切實(shí)有效。 (1) 檔案管理中文書檔案目錄卷數(shù)事實(shí)表:事實(shí)表主鍵, 字段類型int, 字段為id;文書歸檔年份, 字段類型int, 字段為gdyear_key;文書歸檔類型, 字段類型int, 字段為ajtm_key;文書歸檔單位, 字段類型int, 字段為gddw_key;文書檔案生成年份, 字段類型int, 字段為ajscsj_key, 以及文書檔案包括的文件數(shù)目。 (2) 檔案管理中文書檔案卷數(shù)事實(shí)表:事實(shí)表主鍵, 字段類型int, 字段為id;文書歸檔利用日期, 字段類型int, 字段為date_key;文書歸檔利用單位, 字段類型int, 字段為dw_key;文書歸檔利用類別, 字段類型int, 字段為dalb_key;文書歸檔利用年份, 字段類型int, 字段為dayear_key等[1]。
from dag gd temp//刪除臨時表中的數(shù)據(jù)
dag 1.() //將數(shù)據(jù)窗口中的數(shù)據(jù)保存到臨時表
相關(guān)技術(shù)人員要對數(shù)據(jù)進(jìn)行有效處理, 以保證相關(guān)數(shù)據(jù)合并操作、連接操作以及條件性拆分操作等都能按照數(shù)據(jù)預(yù)處理管理要求合理化進(jìn)行, 從根本上維護(hù)數(shù)據(jù)處理效果。
2.3 多維數(shù)據(jù)模型建立單元
在檔案多維數(shù)據(jù)模型建立的過程中, 相關(guān)技術(shù)人員要判定聯(lián)機(jī)分析處理項目和數(shù)據(jù)挖掘方案, 整合信息系統(tǒng)中的數(shù)據(jù)源、數(shù)據(jù)視圖、維度參數(shù)以及屬性參數(shù)等, 保證具體單元能發(fā)揮其實(shí)際作用, 并且真正發(fā)揮檔案維表的穩(wěn)定性、安全性優(yōu)勢。
第一, 檔案事實(shí)表中的數(shù)據(jù)穩(wěn)定, 事實(shí)表是加載和處理檔案數(shù)據(jù)的基本模塊, 按照檔案目錄數(shù)據(jù)表和檔案利用情況表分析和判定其類別和歸檔時間, 從而提高數(shù)據(jù)獨(dú)立分析水平。一方面, 能追加有效的數(shù)據(jù), 保證數(shù)據(jù)倉庫信息的基本質(zhì)量, 也能追加時間判定標(biāo)準(zhǔn), 能在實(shí)際操作中減少掃描整個表浪費(fèi)的時間, 從根本上提高實(shí)際效率。另一方面, 能刪除數(shù)據(jù), 實(shí)現(xiàn)數(shù)據(jù)更新, 檢索相關(guān)關(guān)鍵詞即可。并且也能同時修改數(shù)據(jù), 維護(hù)檔案撤出和檔案追加的動態(tài)化處理效果。
第二, 檔案維表的安全性。在維表管理工作中, 檔案參數(shù)和數(shù)據(jù)的安全穩(wěn)定性十分關(guān)鍵, 由于其不會隨著時間的推移出現(xiàn)變化, 因此, 要對其進(jìn)行合理的處理和協(xié)調(diào)。維表本身的存儲空間較小, 盡管結(jié)構(gòu)發(fā)生變化的概率不大, 但仍會對代表的對象產(chǎn)生影響, 這就會使得數(shù)據(jù)出現(xiàn)動態(tài)的變化。對于這種改變, 需要借助新維生成的方式進(jìn)行處理, 從而保證不同維表能有效連接, 整合正確數(shù)據(jù)的同時, 也能對事實(shí)表外鍵進(jìn)行分析[2]。
隨著互聯(lián)網(wǎng)技術(shù)和數(shù)據(jù)庫技術(shù)不斷進(jìn)步, 要提高檔案數(shù)字化水平以及完善信息化整合機(jī)制, 加快數(shù)據(jù)庫管控體系的更新, 確保設(shè)備存儲以及網(wǎng)絡(luò)環(huán)境一體化水平能滿足需求, 尤其是在檔案資源重組和預(yù)測項目中, 只有從根本上落實(shí)數(shù)據(jù)挖掘體系, 才能為后續(xù)信息檔案管理項目升級奠定堅實(shí)基礎(chǔ)。另外, 在數(shù)據(jù)表和文書等基礎(chǔ)性數(shù)據(jù)結(jié)構(gòu)模型建立的基礎(chǔ)上, 要按照規(guī)律制定具有個性化的主動性服務(wù)機(jī)制。
在實(shí)際檔案分析工作開展過程中, 關(guān)聯(lián)算法描述十分關(guān)鍵, 能對某些行為特征進(jìn)行統(tǒng)籌整合, 從而制定分析決策。在進(jìn)行關(guān)聯(lián)規(guī)則強(qiáng)度分析時, 要結(jié)合支持度和置信度等系統(tǒng)化數(shù)據(jù)進(jìn)行綜合衡量。例如, 檔案數(shù)據(jù)庫中有a和b兩個基礎(chǔ)項集合, 支持度為p (a∪b) , 則直接表述了a和b在同一時間出現(xiàn)的基礎(chǔ)性概率。若是兩者出現(xiàn)的概率并不大, 則證明兩者之間的關(guān)聯(lián)度較低。若是兩者出現(xiàn)的概率較大, 則說明兩者的關(guān)聯(lián)度較高。另外, 在分析置信度時, 利用confidence (a→b) = (a|b) , 也能有效判定兩者之間的關(guān)系。在出現(xiàn)置信度a的情況下, b的出現(xiàn)概率則是整體參數(shù)關(guān)系的關(guān)鍵, 若是置信度的數(shù)值達(dá)到100%, 則直接證明a和b能同一時間出現(xiàn)。
除了要對檔案的實(shí)際內(nèi)容進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)庫建構(gòu), 也要對其利用情況進(jìn)行判定, 目前較為常見的利用率分析算法就是神經(jīng)網(wǎng)絡(luò)算法, 其借助數(shù)據(jù)分類系統(tǒng)判定和分析數(shù)據(jù)對象。值得注意的是, 在分類技術(shù)結(jié)構(gòu)中, 要結(jié)合訓(xùn)練數(shù)據(jù)集判定分類模型數(shù)據(jù)挖掘結(jié)構(gòu)。神經(jīng)網(wǎng)絡(luò)算法類似于人腦系統(tǒng)的運(yùn)行結(jié)構(gòu), 能建立完整的信息處理單元, 并且能夠整合非線性交換結(jié)構(gòu), 確保能憑借歷史數(shù)據(jù)對計算模型和分類體系展開深度分析[3]。
在檔案管理工作中應(yīng)用計算機(jī)數(shù)據(jù)挖掘技術(shù), 能對檔案分類管理予以分析, 保證信息需求分類總結(jié)工作的完整程度。尤其是檔案使用者在對檔案具體特征進(jìn)行差異化分析的過程中, 能結(jié)合不同的元素對具體問題展開深度調(diào)研。一方面, 計算機(jī)數(shù)據(jù)挖掘技術(shù)借助決策樹算法處理規(guī)則化的檔案分析機(jī)制。在差異化訓(xùn)練體系中, 要對數(shù)據(jù)集合中的數(shù)據(jù)進(jìn)行系統(tǒng)化分析以及處理, 確保構(gòu)建要求能適應(yīng)數(shù)據(jù)挖掘的基本結(jié)構(gòu)[4]。例如, 檔案管理人員借助數(shù)據(jù)挖掘技術(shù)能整合檔案使用人員長期瀏覽與關(guān)注的信息, 并且能集中收集和匯總間隔時間、信息查詢停留時間等, 從而建構(gòu)完整的數(shù)據(jù)分析機(jī)制, 有效向其推送或者是提供便捷化查詢服務(wù), 保證檔案管理數(shù)字化水平的提高。另一方面, 在檔案收集管理工作中應(yīng)用數(shù)據(jù)挖掘技術(shù), 主要是對數(shù)據(jù)信息進(jìn)行分析, 結(jié)合基本結(jié)果建立概念模型, 保證模型以及測試樣本之間的比較參數(shù)符合標(biāo)準(zhǔn), 從而真正建立更加系統(tǒng)化的分類框架體系。
總而言之, 在檔案管理工作中應(yīng)用數(shù)據(jù)挖掘技術(shù), 能在準(zhǔn)確判定用戶需求的同時, 維護(hù)數(shù)據(jù)處理效果, 并且減少檔案數(shù)字化的成本, 為后續(xù)工作的進(jìn)一步優(yōu)化奠定堅實(shí)基礎(chǔ)。并且, 數(shù)據(jù)庫的建立, 也能節(jié)省經(jīng)費(fèi)和設(shè)備維護(hù)成本, 真正實(shí)現(xiàn)數(shù)字化全面發(fā)展的目標(biāo), 促進(jìn)檔案信息管理工作的長效進(jìn)步。
參考文獻(xiàn)
摘要:隨著科學(xué)技術(shù)的快速發(fā)展, 各種新鮮的事物和理念得到了廣泛的應(yīng)用。其中機(jī)器學(xué)習(xí)算法就是一則典型案例——作為一種新型的算法, 其廣泛應(yīng)用于各行各業(yè)之中。本篇論文旨在探討機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的具體應(yīng)用, 我們利用龐大的移動終端數(shù)據(jù)網(wǎng)絡(luò), 加強(qiáng)了基于gsm網(wǎng)絡(luò)的戶外終端定位, 從而提出了3個階段的定位算法, 有效提高了定位的精準(zhǔn)度和速度。
移動終端定位技術(shù)由來已久, 其主要是利用各種科學(xué)技術(shù)手段定位移動物體的精準(zhǔn)位置以及高度。目前, 移動終端定位技術(shù)主要應(yīng)用于軍事定位、緊急救援、網(wǎng)絡(luò)優(yōu)化、地圖導(dǎo)航等多個現(xiàn)代化的領(lǐng)域, 由于移動終端定位技術(shù)可以提供精準(zhǔn)的位置服務(wù)信息, 所以其在市場上還是有較大的需求的, 這也為移動終端定位技術(shù)的優(yōu)化和發(fā)展, 提供了推動力。隨著通信網(wǎng)絡(luò)普及, 移動終端定位技術(shù)的發(fā)展也得到了一些幫助, 使得其定位的精準(zhǔn)度和速度都得到了全面的優(yōu)化和提升。同時, 傳統(tǒng)的定位方法結(jié)合先進(jìn)的算法來進(jìn)行精準(zhǔn)定位, 目前依舊還是有較大的進(jìn)步空間。在工作中我選取機(jī)器學(xué)習(xí)算法結(jié)合數(shù)據(jù)挖掘技術(shù)對傳統(tǒng)定位技術(shù)加以改進(jìn), 取得了不錯的效果, 但也遇到了許多問題, 例如:使用機(jī)器學(xué)習(xí)算法來進(jìn)行精準(zhǔn)定位暫時無法滿足更大的區(qū)域要求, 還有想要利用較低的設(shè)備成本, 實(shí)現(xiàn)得到更多的精準(zhǔn)定位的要求比較困難。所以本文對機(jī)器學(xué)習(xí)算法進(jìn)行了深入的研究, 希望能夠幫助其更快速的定位、更精準(zhǔn)的定位, 滿足市場的需要。
數(shù)據(jù)挖掘又名數(shù)據(jù)探勘、信息挖掘。它是數(shù)據(jù)庫知識篩選中非常重要的一步。數(shù)據(jù)挖掘其實(shí)指的就是在大量的數(shù)據(jù)中通過算法找到有用信息的行為。一般情況下, 數(shù)據(jù)挖掘都會和計算機(jī)科學(xué)緊密聯(lián)系在一起, 通過統(tǒng)計集合、在線剖析、檢索篩選、機(jī)器學(xué)習(xí)、參數(shù)識別等多種方法來實(shí)現(xiàn)最初的目標(biāo)。統(tǒng)計算法和機(jī)器學(xué)習(xí)算法是數(shù)據(jù)挖掘算法里面應(yīng)用得比較廣泛的兩類。統(tǒng)計算法依賴于概率分析, 然后進(jìn)行相關(guān)性判斷, 由此來執(zhí)行運(yùn)算。
而機(jī)器學(xué)習(xí)算法主要依靠人工智能科技, 通過大量的樣本收集、學(xué)習(xí)和訓(xùn)練, 可以自動匹配運(yùn)算所需的相關(guān)參數(shù)及模式。它綜合了數(shù)學(xué)、物理學(xué)、自動化和計算機(jī)科學(xué)等多種學(xué)習(xí)理論, 雖然能夠應(yīng)用的領(lǐng)域和目標(biāo)各不相同, 但是這些算法都可以被獨(dú)立使用運(yùn)算, 當(dāng)然也可以相互幫助, 綜合應(yīng)用, 可以說是一種可以“因時而變”、“因事而變”的算法。在機(jī)器學(xué)習(xí)算法的領(lǐng)域, 人工神經(jīng)網(wǎng)絡(luò)是比較重要和常見的一種。因為它的優(yōu)秀的數(shù)據(jù)處理和演練、學(xué)習(xí)的能力較強(qiáng)。
而且對于問題數(shù)據(jù)還可以進(jìn)行精準(zhǔn)的識別與處理分析, 所以應(yīng)用的頻次更多。人工神經(jīng)網(wǎng)絡(luò)依賴于多種多樣的建模模型來進(jìn)行工作, 由此來滿足不同的數(shù)據(jù)需求。綜合來看, 人工神經(jīng)網(wǎng)絡(luò)的建模, 它的精準(zhǔn)度比較高, 綜合表述能力優(yōu)秀, 而且在應(yīng)用的過程中, 不需要依賴專家的輔助力量, 雖然仍有缺陷, 比如在訓(xùn)練數(shù)據(jù)的時候耗時較多, 知識的理解能力還沒有達(dá)到智能化的標(biāo)準(zhǔn), 但是, 相對于其他方式而言, 人工神經(jīng)網(wǎng)絡(luò)的優(yōu)勢依舊是比較突出的。
建模的過程主要是以支持向量機(jī)定位方式作為基礎(chǔ), 把定位的位置柵格化, 面積較小的柵格位置就是獨(dú)立的一種類別, 在定位的位置內(nèi), 我們收集數(shù)目龐大的終端測量數(shù)據(jù), 然后利用計算機(jī)對測量報告進(jìn)行分析處理, 測量柵格的距離度量和精準(zhǔn)度, 然后對移動終端柵格進(jìn)行預(yù)估判斷, 最終利用機(jī)器學(xué)習(xí)進(jìn)行分析求解。
本次研究, 我們采用的模型對象是我國某一個周邊長達(dá)10千米的二線城市。在該城市區(qū)域內(nèi), 我們測量了四個不同時間段內(nèi)的數(shù)據(jù), 為了保證機(jī)器學(xué)習(xí)算法定位的精準(zhǔn)性和有效性, 我們把其中的三批數(shù)據(jù)作為訓(xùn)練數(shù)據(jù), 最后一組數(shù)據(jù)作為定位數(shù)據(jù), 然后把定位數(shù)據(jù)周邊十米內(nèi)的前三組訓(xùn)練數(shù)據(jù)的相關(guān)信息進(jìn)行清除。一旦確定某一待定位數(shù)據(jù), 就要在不同的時間內(nèi)進(jìn)行測量, 按照測量出的數(shù)據(jù)信息的經(jīng)緯度和平均值, 再進(jìn)行換算, 最終, 得到真實(shí)的數(shù)據(jù)量, 提升定位的速度以及有效程度。
用機(jī)器學(xué)習(xí)算法來進(jìn)行移動終端定位, 其復(fù)雜性也是比較大的, 一旦區(qū)域面積增加, 那么模型和分類也相應(yīng)增加, 而且更加復(fù)雜, 所以, 利用機(jī)器學(xué)習(xí)算法來進(jìn)行移動終端定位的過程, 會隨著定位區(qū)域面積的增大, 而耗費(fèi)更多的時間。利用基站的經(jīng)緯度作為基礎(chǔ)來進(jìn)行早期的定位, 則需要以下幾個步驟:要將邊長為十千米的正方形分割成一千米的小柵格, 如果想要定位數(shù)據(jù)集內(nèi)的相關(guān)信息, 就要選擇對邊長是一千米的小柵格進(jìn)行計算, 而如果是想要獲得邊長一千米的大柵格, 就要對邊長是一千米的柵格精心計算。
在完成初步定位工作后, 要確定一個邊長為兩千米的正方形, 由于第一級支持向量機(jī)定位的區(qū)域是四百米, 定位輸出的是以一百米柵格作為中心點(diǎn)的經(jīng)緯度數(shù)據(jù)信息, 相對于一級向量機(jī)的定位而言, 二級向量機(jī)在定位計算的時候難度是較低的`, 更加簡便。后期的預(yù)算主要依賴決策函數(shù)計算和樣本向量機(jī)計算。隨著柵格的變小, 定位的精準(zhǔn)度將越來越高, 而由于增加分類的問題數(shù)量是上升的, 所以, 定位的復(fù)雜度也是相對增加的。
第一步要做的就是選定需要定位的區(qū)域面積, 在二次輸出之后, 確定其經(jīng)緯度, 然后依賴經(jīng)緯度來確定邊長面積, 這些都是進(jìn)行區(qū)域定位的基礎(chǔ)性工作, 緊接著就是定位模型的訓(xùn)練。以k-近鄰法為基礎(chǔ)的三次定位需要的是綜合訓(xùn)練信息數(shù)據(jù), 對于這些信息數(shù)據(jù), 要以大小為選擇依據(jù)進(jìn)行篩選和合并, 這樣就能夠減少計算的重復(fù)性。當(dāng)然了, 選擇的區(qū)域面積越大, 其定位的速度和精準(zhǔn)性也就越低。
近年來, 隨著我國科學(xué)技術(shù)的不斷發(fā)展和進(jìn)步, 數(shù)據(jù)挖掘技術(shù)愈加重要。根據(jù)上面的研究, 我們證明了, 在數(shù)據(jù)挖掘的過程中, 應(yīng)用機(jī)器學(xué)習(xí)算法具有舉足輕重的作用。作為一門多領(lǐng)域互相交叉的知識學(xué)科, 它能夠幫助我們提升定位的精準(zhǔn)度以及定位速度, 可以被廣泛的應(yīng)用于各行各業(yè)。所以, 對于機(jī)器學(xué)習(xí)算法, 相關(guān)人員要加以重視, 不斷的進(jìn)行改良以及改善, 切實(shí)的發(fā)揮其有利的方面, 將其廣泛應(yīng)用于智能定位的各個領(lǐng)域, 幫助我們解決關(guān)于戶外移動終端的定位的問題。
參考文獻(xiàn)
摘要:數(shù)據(jù)挖掘是指在大數(shù)據(jù)中開發(fā)出有價值信息數(shù)據(jù)的過程。計算機(jī)技術(shù)的不斷進(jìn)步, 通過人工的方式進(jìn)行軟件的開發(fā)與維護(hù)難度較大。而數(shù)據(jù)挖掘能夠有效的提升軟件開發(fā)的效率, 并能夠在大量的數(shù)據(jù)中獲得有效的數(shù)據(jù)。文章主要探究軟件工程中數(shù)據(jù)挖掘技術(shù)的任務(wù)和存在的問題, 并重點(diǎn)論述軟件開發(fā)過程中出現(xiàn)的問題和相關(guān)的解決措施。
(1) 在軟件工程中, 對有效數(shù)據(jù)的挖掘和處理;
(2) 挖掘數(shù)據(jù)算法的選擇問題;
(3) 軟件的開發(fā)者該如何選擇數(shù)據(jù)。
軟件工程數(shù)據(jù)主要包括兩種, 一種是軟件報告, 另外一種是軟件的版本信息。當(dāng)然還包括一些軟件代碼和注釋在內(nèi)的非結(jié)構(gòu)化數(shù)據(jù)信息。這兩種軟件工程數(shù)據(jù)的算法是不同的, 但是兩者之間又有一定的聯(lián)系, 這也是軟件工程數(shù)據(jù)挖掘復(fù)雜性的重要原因。
傳統(tǒng)的數(shù)據(jù)挖掘結(jié)果可以通過很多種結(jié)果展示出來, 最常見的有報表和文字的方式。但是對于軟件工程的數(shù)據(jù)挖掘來講, 它最主要的職能是給軟件的研發(fā)人員提供更加精準(zhǔn)的案例, 軟件漏洞的實(shí)際定位以及設(shè)計構(gòu)造方面的信息, 同時也包括數(shù)據(jù)挖掘的統(tǒng)計結(jié)果。所以這就要求軟件工程的數(shù)據(jù)挖掘需要更加先進(jìn)的結(jié)果提交方式和途徑。
我國傳統(tǒng)的數(shù)據(jù)挖掘已經(jīng)初步形成統(tǒng)一的評價標(biāo)準(zhǔn), 而且評價體系相對成熟。但是軟件工程的數(shù)據(jù)挖掘過程中, 研發(fā)人員需要更多復(fù)雜而又具體的數(shù)據(jù)信息, 所以數(shù)據(jù)的表示方法也相對多樣化, 數(shù)據(jù)之間難以進(jìn)行對比, 所以也就難以達(dá)成一致的評價標(biāo)準(zhǔn)和結(jié)果。不難看出, 軟件工程數(shù)據(jù)挖掘的關(guān)鍵在于對挖掘數(shù)據(jù)的預(yù)處理和對數(shù)據(jù)結(jié)果的表示方法。
軟件在研發(fā)階段主要的任務(wù)是對軟件運(yùn)行程序的編寫。以下是軟件在編碼和結(jié)果的提交過程中出現(xiàn)的問題和相應(yīng)的解決措施。
(2) 軟件的研發(fā)人員可以搜尋可以重用的靜態(tài)規(guī)則, 比如繼承關(guān)系等。
(3) 軟件的開發(fā)人員搜尋可以重用的動態(tài)規(guī)則。
包括軟件的接口調(diào)用順序等。在尋找以上信息的過程中, 通常是利用軟件的幫助文檔、尋求外界幫助和搜集代碼的方式實(shí)現(xiàn), 但是以上方式在搜集信息過程中往往會遇到較多的問題, 比如:幫助文檔的準(zhǔn)確性較低, 同時不夠完整, 可利用的重用信息不多等。
(1) 軟件的開發(fā)人員創(chuàng)建同時具備例程和上下文架構(gòu)的代碼庫;
(2) 軟件的研發(fā)人員能夠向代碼庫提供類的相關(guān)信息, 然后對反饋的結(jié)果進(jìn)行評估, 創(chuàng)建新型的代碼庫。
(3) 未來的研發(fā)人員在搜集過程中能夠按照評估結(jié)果的高低排序, 便于查詢, 極大地縮減工作人員的任務(wù)量, 提升其工作效率。
(1) 軟件的研發(fā)人員能夠規(guī)定動態(tài)規(guī)則的順序, 主要表現(xiàn)在:使用某一函數(shù)是不能夠調(diào)用其他的函數(shù)。
(2) 實(shí)現(xiàn)對相關(guān)數(shù)據(jù)的保存, 可以通過隊列等簡單的數(shù)據(jù)結(jié)構(gòu)完成。在利用編譯拓展中檢測其中的順序。
(3) 能夠?qū)㈠e誤的信息反饋給軟件的研發(fā)人員。
在軟件工程的數(shù)據(jù)挖掘過程中, 數(shù)據(jù)挖掘的概念才逐步被定義, 但是所需要挖掘的數(shù)據(jù)是已經(jīng)存在的。數(shù)據(jù)挖掘技術(shù)在軟件工程中的運(yùn)用能夠降低研發(fā)人員的工作量, 同時軟件工程與數(shù)據(jù)挖掘的結(jié)合是計算機(jī)技術(shù)必然的發(fā)展方向。從數(shù)據(jù)挖掘的過程來講, 在其整個實(shí)施過程和周期中都包括軟件工程。而對數(shù)據(jù)挖掘的技術(shù)手段來講, 它在軟件工程中的運(yùn)用更加普遍。在對數(shù)據(jù)挖掘技術(shù)的研究過程中可以發(fā)現(xiàn), 該技術(shù)雖然已經(jīng)獲得一定的效果, 但是還有更多未被挖掘的空間, 還需要進(jìn)一步的研究和發(fā)現(xiàn)。
參考文獻(xiàn)
的論文論文大概幾頁a紙篇四
模具cad/cam軟件的應(yīng)用與開發(fā)現(xiàn)狀 模具cad/cam是在模具cad和模具cam分別發(fā)展的基礎(chǔ)上發(fā)展起來的,它是計算機(jī)技術(shù)在模具生產(chǎn)中綜合應(yīng)用的一個新的飛躍。模具cad/cam是改造傳統(tǒng)模具生產(chǎn)方式的關(guān)鍵技術(shù),是一項高科技、高效益的系統(tǒng)工種。它以計算機(jī)軟件的形式,為用戶提供一種有效的輔助工具,使工種技術(shù)人員能借助于計算機(jī)對產(chǎn)品、模具結(jié)構(gòu)、成形工藝、數(shù)控加工及成本等進(jìn)行設(shè)計和優(yōu)化。模具cad/cae在技術(shù)的迅猛發(fā)展,軟件,硬件水平的進(jìn)一步完善,為模具工業(yè)提供了強(qiáng)有力的技術(shù)支持,為企業(yè)的產(chǎn)品設(shè)計,制造和生產(chǎn)水平的發(fā)展帶來了質(zhì)的飛躍,已經(jīng)成為現(xiàn)代企業(yè)信息化,集成化、網(wǎng)絡(luò)化的最優(yōu)選擇。
一、模具cad/cam發(fā)展概況
cad/cam 軟件的發(fā)展現(xiàn)狀如下:cad技術(shù)經(jīng)歷了二維平面圖形設(shè)計,交互式圖形設(shè)計、三維線框模型設(shè)計、三維實(shí)體造型設(shè)計、自由曲面造型設(shè)計、參數(shù)化設(shè)計、特征造型設(shè)計等發(fā)展過程。近年來又出現(xiàn)了許多先進(jìn)技術(shù),如變量化技術(shù)、虛擬產(chǎn)品建模技術(shù)等。隨著互聯(lián)網(wǎng)的普及,智能化(intelligent)、協(xié)同化(collaborative)、集成化(integrated)成為技術(shù)新的發(fā)展特點(diǎn),使cad技術(shù)得以更廣泛的應(yīng)用,發(fā)展成為支持協(xié)同設(shè)計、異地設(shè)計和信息共享的網(wǎng)絡(luò)cad。
二、模具cad/cam的特點(diǎn)
一個穩(wěn)定的、可以滿足實(shí)際生產(chǎn)設(shè)計需要的模具cad/cam系統(tǒng)應(yīng)該具備下列特點(diǎn):(l)模具cad/cam系統(tǒng)必須具備描述物體幾何形狀的能力。模具設(shè)計中因為模具的工作部分(如拉深模、鍛模和注射模的型腔)是根據(jù)產(chǎn)品零件的形狀設(shè)計的。所以無論設(shè)計什么類型的模具,開始階段必須提供產(chǎn)品零件的幾何形狀。否則,就無法輸人關(guān)于產(chǎn)品零件的幾何信息,設(shè)計程序便無法運(yùn)行。另外,為了編制nc加工程序,計算刀具軌跡,也需要建立模具零件的幾何模型。因此,幾何造型是模具cad/cam中的一個重要問題。
(2)標(biāo)準(zhǔn)化是實(shí)現(xiàn)模具cad的必要條件。模具設(shè)計一般不具有唯一性。為了便于實(shí)現(xiàn)模具cad,減少數(shù)據(jù)的存儲量,在建立模具cad系統(tǒng)時首先要解決的問題便是標(biāo)準(zhǔn)化問題,包括設(shè)計準(zhǔn)則的標(biāo)準(zhǔn)化、模具零件和模具結(jié)構(gòu)的標(biāo)準(zhǔn)化。有了標(biāo)準(zhǔn)化的模具結(jié)構(gòu),在設(shè)計模具時可以選用典型的模具組合,調(diào)用標(biāo)準(zhǔn)模具零件,需要設(shè)計的只是少數(shù)工作零件。
(3)設(shè)計準(zhǔn)則的處理是模具cad中的一個重要問題。人工設(shè)計模具所依據(jù)的設(shè)計準(zhǔn)則大部分是以數(shù)表和線圖形式給出的。
三、模具cad/cam的優(yōu)勢
計算機(jī)與設(shè)計人員交互作用,有利于發(fā)揮人機(jī)各自的特長,使模具設(shè)計和制造工藝更加合理化。系統(tǒng)采用的優(yōu)化設(shè)計方法有助于某些工藝參數(shù)和模具結(jié)構(gòu)的優(yōu)化。
(1)cad/cam可以節(jié)省時間,提高生產(chǎn)率。設(shè)計計算和圖樣繪制的自動化大大縮短了設(shè)計時間。cad與cam的一體化可顯著縮短從設(shè)計到制造的周期。
(2)cad/cam可以較大幅度地降低成本。計算機(jī)的高速運(yùn)算和自動繪圖大大節(jié)省了勞動力。優(yōu)化設(shè)計帶來了原材料的節(jié)省,例如,沖壓件的毛坯優(yōu)化排樣可使材料利用率提高5%―7%。采用cam可加工傳統(tǒng)方法難以加工的復(fù)雜模具型面,可減少模具的加工和調(diào)試工時,使制造成本降低。cad/cam的經(jīng)濟(jì)效益有些可以估算、有些則難以估算。由于采用cad/cam術(shù),生產(chǎn)準(zhǔn)備時間縮短,產(chǎn)品更新?lián)Q代加快,大大增強(qiáng)了產(chǎn)品的市場競爭能力。
(3)cae/cam技術(shù)將技術(shù)人員從繁冗的計算、繪圖和nc編程工作中解放出來,使其可以從事更多的創(chuàng)造性勞動。
(4)隨著塑性成形過程計算機(jī)模擬技術(shù)的提高,模具cad/cam/cae一體化技術(shù)可以大大增加模具的可靠性,減少直至不需要試模修模過程,提高模具設(shè)計、制造的一次成功率。
四、模具行業(yè)采用模具cad/cam技術(shù)的原因
(1)利用幾何造型技術(shù)獲得的幾何模型可供后續(xù)的設(shè)計分析和數(shù)控編程等方面使用。
(2)可以縮短新產(chǎn)品的試制周期,例如在汽車工業(yè)中,可縮短模具的設(shè)計制造周期。(3)提高產(chǎn)品質(zhì)量的需要,如汽車車身表面等形狀,需要利用計算機(jī)準(zhǔn)備數(shù)據(jù)和完成隨后的制造工作。
(4)模具制造廠和用戶對cad/cam的需要增加。例如,利用磁盤進(jìn)行數(shù)據(jù)傳送,用戶要求模具制造單位能夠交換信息和處理這些數(shù)據(jù)。
(5)模具加工設(shè)備的效率不斷提高,需要計算機(jī)輔助處理數(shù)據(jù),以提高設(shè)備利用率。
(6)在企業(yè)中建立聯(lián)系各個部門的信息處理系統(tǒng)。
五、模具cad/cam技術(shù)在模典行業(yè)的應(yīng)用現(xiàn)狀
模具 cad/cam技術(shù)發(fā)展很快。應(yīng)用范圍日益擴(kuò)大。在沖模、鍛模、擠壓模、注射模和壓鑄模等方面都有比較成功的cad/cam系統(tǒng)。采用cad/cam技術(shù)是模具技術(shù)、生產(chǎn)革新化的措施,是模具技術(shù)發(fā)展的一個顯著特點(diǎn)。
目前我國模具行業(yè)應(yīng)用的模具cad/cam軟件可以分為兩大類:一是機(jī)械行業(yè)內(nèi)通用的的cad/cam,如前面介紹的unigraphic、solidedge、autocad、solidworks、pro/engneer等。二是專門針對模具行業(yè)開發(fā)的模具cad/cam系統(tǒng),如:上海交大模具cad國家工程中心開發(fā)的冷沖模cad系統(tǒng)等。
(1)國外模具cad/cam技術(shù)的應(yīng)用現(xiàn)狀
cad/cam系統(tǒng)。該系統(tǒng)包括設(shè)計覆蓋件的ntdfb和cadeit軟件和加工凸、凹模的tinca軟件。利用三坐標(biāo)測量儀測量粘土模型,并將數(shù)據(jù)送人計算機(jī)。將所得圖形經(jīng)平滑處理后,再把這些數(shù)據(jù)用于覆蓋件設(shè)計、沖模的設(shè)計與制造。該系統(tǒng)有較強(qiáng)的三維圖形功能,可在屏幕上反復(fù)修改曲面形狀,使工件在沖壓成形時不致產(chǎn)生工藝缺陷,從而保證了模具和工件的質(zhì)量。模具型面的模型保存在數(shù)據(jù)庫中,tinca軟件可利用這些數(shù)據(jù),進(jìn)行模具型面的數(shù)控加工。
(2)國內(nèi)模具cad/cam技術(shù)的應(yīng)用現(xiàn)狀
經(jīng)過近幾十年的發(fā)展,在國內(nèi)的模具生產(chǎn)中,cad/cam技術(shù)已經(jīng)得到廣泛的應(yīng)用。模具行業(yè)已引進(jìn)相當(dāng)數(shù)量的國外cad/cae系統(tǒng),如: unigraphic、solidedge、autocad、solidworks、pro/engineer等。并配置了運(yùn)行速度快、性能高的計算機(jī)。但是對于國內(nèi)一些大型模具企業(yè),它們的cad/cam應(yīng)用狀況多停留在從國外購買先進(jìn)的cad/cam系統(tǒng)和設(shè)備,但在其上進(jìn)行的二次開發(fā)較少,資源利用率低;對于國內(nèi)一些中小型模具企業(yè),它們的cad/cam應(yīng)用很少,有些僅停留在以計算機(jī)代替畫板繪圖。所以有必要改善國內(nèi)模具企業(yè)的cad/cam應(yīng)用狀況,使它們真正做到快速、準(zhǔn)確地對市場做出反應(yīng),并使制造的模具產(chǎn)品質(zhì)量高、成本低,即達(dá)到敏捷制造的目的。
六、我國模具cad/cam軟件自主開發(fā)和二次開發(fā)情況
我國模具cad/cae的開發(fā)開始于20 世紀(jì)70年代末,發(fā)展也很迅速。在微機(jī)平臺上開發(fā)cad/cam軟件方面我國與國外起點(diǎn)差不多,都是使用visual c++,opengl等工具進(jìn)行軟件開發(fā),國內(nèi)許多高校、軟件公司和企業(yè)在此基礎(chǔ)上開發(fā)出了先進(jìn)的,有自己特色,符合中國用戶習(xí)慣的cad/cae軟件或模塊,其中有一些成果已經(jīng)得到了推廣和使用。國內(nèi)開發(fā)適合模具行業(yè)的cad/cam軟件,主要采用兩種途徑――在現(xiàn)有cad/cam平臺上進(jìn)行二次開發(fā)和開發(fā)擁有自主版權(quán)的cad/cam系統(tǒng)。
(1)基于現(xiàn)有模具cad/cam平臺二次開發(fā)成果
華中科技大學(xué)1997推出了hsc2.0注射模cad/cae/cam集成系統(tǒng),hsc2.0系統(tǒng)以autocad 軟件包為圖形支撐平臺,包括模具結(jié)構(gòu)設(shè)計子系統(tǒng),結(jié)構(gòu)及工藝參數(shù)計算較核子系統(tǒng),塑料流動、冷卻等子系統(tǒng)等。合肥工業(yè)大學(xué)基于autocad與mdt的三維參數(shù)化注射模系統(tǒng)ipmcadv4.0。
(2)自行開發(fā)的擁有自主版權(quán)的模其cad/cam系統(tǒng)
由北京北航海爾軟件有限公司推出的三維電子圖板和caxa―me制造工程師2000,能進(jìn)行3d零件設(shè)計與nc加工,其特點(diǎn)是基于3d參數(shù)化的特征設(shè)計,實(shí)現(xiàn)了實(shí)體、曲面和nc加工的協(xié)調(diào)與統(tǒng)一。上海交通大學(xué)中模公司開發(fā)的金屬塑性成型三維有限元仿真系統(tǒng),其剛(粘)塑性有限元分析器和動態(tài)邊界處理技術(shù)達(dá)到了國際先進(jìn)水平。吉林金網(wǎng)格模具工程研究中心所開發(fā)的沖壓模具cad/cae/cam一體化系統(tǒng)。浙江大天電子信息工程有限公司開發(fā)的基于特征的參數(shù)化造型系統(tǒng)gs一cad98。金銀花(lonicera)系統(tǒng)是由廣州紅地技術(shù)有限公司開發(fā)的基于step標(biāo)準(zhǔn)的cad/cam系統(tǒng)。開目cad是華中理工大學(xué)機(jī)械學(xué)院開發(fā)的具有自主版權(quán)的基于微機(jī)平臺的cad和圖紙管理軟件。中科院凱思軟件集團(tuán)及北京凱思博宏應(yīng)用工程公司開發(fā)了具有自主版權(quán)的picad系統(tǒng)及系列軟件。這些軟件已經(jīng)在許多模具行業(yè)中的企業(yè)得到推廣和應(yīng)用。
七、我國模具cad/cam軟件應(yīng)用與開發(fā)中存在的主要不足
(l)不少的企業(yè)對cad的認(rèn)識還僅僅停留在繪圖階段,缺乏設(shè)計方法和設(shè)計理論的指導(dǎo),從而使cad產(chǎn)生的效益尚未得到充分發(fā)揮。
(2)cad/cam軟件應(yīng)用人員層次不齊,不能讓cad軟件得到的高效率應(yīng)用。
(3)在引進(jìn)模具cad/cam技術(shù)時存在著盲目性傾向,許多企業(yè)沒有充分考慮各種cad/cam軟件的特點(diǎn),購買回來的cad/cam軟件不能完全適用于本企業(yè)的產(chǎn)品設(shè)計與開發(fā)工作。
(4)引進(jìn)的模具cad/cae系統(tǒng)的二次開發(fā)跟不上,致使引進(jìn)軟件的效率不能完全發(fā)揮。
(5)國內(nèi)模具cad/cam技術(shù)水平還處于高技術(shù)集成和向產(chǎn)業(yè)化、商品化過渡的時期,自主開發(fā)的模具cad/cam系統(tǒng)商品化程度不夠高,功能和穩(wěn)定方面與國外先進(jìn)軟件還有很大差距。
(6)我國cad技術(shù)開發(fā)創(chuàng)新少、仿制多。沒有創(chuàng)新就沒有競爭力,只仿制就不能開發(fā)出有競爭力的產(chǎn)品。從我國二維cad到目前研制的三維cad都存在這一問題。
術(shù),涉及面廣而復(fù)雜,技術(shù)變化快,競爭激烈。
(8)信息集成技術(shù)落后。信息技術(shù)的廣泛集成是以產(chǎn)品數(shù)據(jù)管理(pdm)和過程管理(pm)為基礎(chǔ),實(shí)現(xiàn)cad/capp/cam和erp的有機(jī)集成,在并行工程中pdm也是重要的基礎(chǔ)。因此,這類基礎(chǔ)性軟件也被國外的系統(tǒng)占領(lǐng)了市場。而我們的cad/capp/cam集成技術(shù)又是建立在國外基礎(chǔ)系統(tǒng)上。
八、結(jié)論
在模具cad/cam的應(yīng)用方面,我國模具cad/cam的應(yīng)用有了長足的發(fā)展,模具cad/cam技術(shù)已經(jīng)被廣泛應(yīng)用于我國企業(yè)。
cad/cam技術(shù)水平還處于高技術(shù)集成和向產(chǎn)業(yè)化商品化過渡的時期,自主開發(fā)的模具cad/cam軟件的開發(fā)水平、商品化、市場化程度都不如發(fā)達(dá)國家。軟件在可靠性和穩(wěn)定性方面與國外工業(yè)發(fā)達(dá)國家的軟件尚有一些差距。
的論文論文大概幾頁a紙篇五
在社會的各個領(lǐng)域,大家都寫過論文吧,借助論文可以有效提高我們的寫作水平。為了讓您在寫論文時更加簡單方便,以下是小編為大家收集的科技論文-議論文900字,供大家參考借鑒,希望可以幫助到有需要的朋友。
夏天來了,天氣炎熱。許多小伙伴們都喜歡買冰鎮(zhèn)飲料。喝上一口啊,美滋滋。不少同學(xué)會發(fā)現(xiàn)白天喝飲料的時候,這吸管怎么歪了呢?喝的正舒暢呢,這吸管彎了,我怎么喝啊?別急別急,其實(shí)我們喝飲料的時候,就會遇見一個有趣的科學(xué)原理——光的折射現(xiàn)象。
折射定律——由荷蘭數(shù)學(xué)家斯涅爾發(fā)現(xiàn)。簡單來說,光在水中和空氣中的傳輸速度是不一樣的,導(dǎo)致他們的傳播方向也不一樣。因為光具有折射作用,從水面以下折射到水面上的光在不同的介質(zhì)中被折射了(介質(zhì)也就是水和空氣)不知道。光從空氣到水的途中要經(jīng)過兩種介質(zhì),所以這兩種介質(zhì)的交界處發(fā)生了變化。那么折射到我們?nèi)庋壑械木褪枪茏渝e開的現(xiàn)象。
因為光的幾種特性。出現(xiàn)了一些特別的自然景觀。比如神秘的海市蜃樓,現(xiàn)在我們或許可以用科學(xué)的理論去解釋這一自然景象的發(fā)生。光通過空氣,直射入水中,然后折射到大氣里,最后可能會折射到沙灘上,湖面上。新聞報告有說一座城市突然出現(xiàn)在水面上。實(shí)在是令人驚嘆。但海市蜃樓的出現(xiàn)與地理位置、地球物理條件以及那些地方在特定時間的氣象特點(diǎn)等都有著密切聯(lián)系,所以是非常少見的自然景觀了。
自然界真是偉大。有著千千萬萬的神奇的事物等著人類去追尋。我們一定不會停止探索的腳步,學(xué)科學(xué),漲知識,思考他們的道理。一根吸管就可以引起我們無窮的幻想。我相信在我的未來還會有這樣無數(shù)根“吸管”,等著我向它發(fā)出疑問,一步步解決。這就是學(xué)科學(xué)學(xué)物理的樂趣。