我國的數據挖掘技術現狀分析論文
摘要:數據挖掘學科的出現, 是對計算機領域的補充, 在計算機領域的發展下發展迅速, 引起了國內的重視, 并在國家的大力促進下不斷發展, 取得了階段性的成就, 但是發展現狀仍然不容樂觀, 本篇文章將針對數據挖掘的定義以及國內的現狀進行分析, 并對其發展趨勢進行預測, 目的在于加快我國的數據挖掘技術研究進程。
關鍵詞:數據挖掘; 中國; 現狀; 發展;
0 引言
隨著計算機的發展與數據量的增加, 其對于數據的處理技術如生成、收集、儲存數據等的水平要求越來越高, 因此新型的數據挖掘技術的出現是必然趨勢, 替代了傳統落后的數據處理技術。我國對于數據挖掘技術的研究已經取得矚目的效果, 但是應用程度不高, 提高數據挖掘技術的實際應用成為了主要的問題, 需要采取必要措施加快數據挖掘技術應用進程。
1 數據挖掘的定義
數據挖掘 (DM) 是一個新興的學科, 學名叫做數據庫中發現知識 (KDD) , 其出現在20世紀90年代, 并在這三十年間發展迅速, 它的主要工作領域為數據庫系統以及數據庫應用領域, 其作用在于能夠從應用數據中提取隱藏的關鍵信息與知識, 應用數據的范圍廣泛, 不管是不完整的數據, 還是受干擾的數據, 數據挖掘技術都能夠通過對其數據的轉換分析或者模塊化處理進行識別與篩選, 并提取和處理其中的有用信息。數據挖掘的目的在于通過對數據中信息的處理, 篩選關鍵數據, 發現被忽略的數據, 從而尋找數據中的規律, 為決策者提供合理科學的數據分析報告, 幫助其作出最優化的決策。
數據挖掘技術學科的本質在于加深對數據的使用層次, 挖掘數據的內在含義并進行抽象化的概括, 改變了以往數據只能簡單查詢的低級層次。數據挖掘具有先知性、實用性以及科學性的特點, 同時數據挖掘的發展依賴于數據庫、人工智能統計學等計算機學科的快速發展, 因此吸引了一大批專業人才加入到其的研發過程中, 加快了其的研究發展進程。
2 數據挖掘在中國的現狀分析
2.1 研究現狀分析
我國開展數據挖掘技術的研究在1993年, 中科院合肥分院成為首個被自然科學基金支持進行數據挖掘技術研究, 從此以后, 我國掀開了研究數據挖掘研究的序幕, 主要研究機構與人員主要是相關專業的大學教授以及一些數據處理研究機構。近年來, 我國對數據挖掘的研究工作高度重視, 通過中國自然科學基金等對其進行資金支持, 同時, 政府創立“九五”計劃以及“863”計劃對其提供政策支持。
數據挖掘的研究引起了我國相關專業的人才的廣泛關注, 并在全國范圍內掀起了研究數據挖掘知識技術的'理論與實際應用的熱潮, 其中包括高等學府與科研機構。例如:對于數據挖掘技術的算法計算與改造研究是復旦大學與華中理工大學等高校的研究方向, 非結構化數據知識的網頁數據挖掘技術是南京大學的主要研究方向, 而科研機構如北京系統工程研究院來說, 其主要研究方向是數據挖掘技術在模糊信息中的實際應用。
2.2 應用現狀分析
在我國, 能夠真正應用數據挖掘技術并取得成就的公司包括是廣州華工明天科技有限公司以及菲奈特-融通企業, 其中廣州華工明天科技有限公司主要進行多功能數據挖掘設備的研發, 而菲奈特-融通企業依賴于數據挖掘軟件的發展進行其商業智能套件的研發。
2.3 研究成果分析
近年來, 由于國家的大力扶植與資金支持, 我國數據挖掘技術研究取得了重要性的成果, 在亞太數據挖掘的國際會議中, 由南京大學周志華帶隊的數據挖掘技術研究小組表現突出, 同時參與數據挖掘編程大賽并奪得桂冠;同樣在了亞太數據挖掘國際會議上, 中國香港大學的電子商業科技研究院的黃哲學教授的論文獲得亞太數據挖掘國際會議論文大獎。
2.4 國內外對比
國內外的數據挖掘技術研究的進程具有很大的差距, 不僅表現在相關理論的研究上, 更在于對數據挖掘技術的實際應用的方面。與國外的數據挖掘技術研究進程相比, 我國的研究起步晚, 仍然處于發展的初級階段, 并且還沒有成熟的理論與技術應用成果, 目前的主要研究方向是對于數據的初級處理如模糊化處理, 技術尚不成熟。
國外關于數據挖掘技術的軟件研發發展已經取得矚目的成就, 而國內的軟件研發尚不成熟, 研究的重心在于高等學府的人才, 同時都是屬于政府資助項目, 可能導致其成果要求較低, 從而阻塞了研發的步伐。
3 數據挖掘在我國的未來發展
3.1 研究方向展望
近年來, 隨著計算機科學領域的快速發展, 數據挖掘技術作為一種新興的學科, 其研究熱度正在逐漸升溫, 研究的水平也在逐步提高, 同時由于政府的政策支持與資金支持, 越來越多的數據專業研究者被吸引加入其中。在數據挖掘技術未來的研究過程中, 其主要方向應包括以下幾點:
(1) 參照于SQL語言的標準化的研究成果, 對數據挖掘技術進行形式化的描述, 即發現數據語言。 (2) 為實現關于數據額挖掘技術人機交互工作的順利開展, 應滿足用戶對知識發現過程的可視化進程。 (3) 研究在計算機領域的數據挖掘技術的發展, 可以通過數據挖掘服務器的有效配合的方式實現。
3.2 面臨的問題
(1) 挖掘方法與人機交互問題。我國數據挖掘技術的發展受限制于挖掘方法, 不管是知識類型的限制, 還是維度上的限制, 都是影響其發展的重要因素。 (2) 性能問題。能夠有效的解決數據挖掘技術算法中的問題是解決其性能問題的關鍵, 應對其有效性、可伸縮性等問題進行研究, 保證其算法能夠滿足用戶的性能要求。 (3) 數據類型多樣性問題。對于算法復雜的, 多維度的數據類型, 現有的研究水平很難去解決此類問題, 同時對于多跨度的全球化信息技術的挖掘水平仍然落后。
4 結束語
數據挖掘技術作為新興的數據應用工具, 能夠有效的加強對數據的處理程度, 但是由于我國研發起步晚, 導致我國的發展水平落后與國外水平。近年來, 國家對數據挖掘技術的政策與資金支持, 掀起了研究的熱潮。我國應重視數據挖掘算法研究以及其實際應用, 不斷地發展數據挖掘技術的研究。
參考文獻
[1]謝邦昌, 李揚.數據挖掘與商業智能的現況及未來發展[J].統計與信息論壇, 2015 (05) :94-96.
[2]李菁菁, 邵培基, 黃亦瀟.數據挖掘在中國的現狀和發展研究[J].管理工程學報, 2016 (03) :10-15.
【我國的數據挖掘技術現狀分析論文】相關文章:
分析在課程教學中數據挖掘技術的選擇論文10-15
大數據自動分析與數據挖掘探討的論文11-28
數據挖掘技術在WEB的運用論文11-28
數據挖掘論文03-31
我國預算績效管理現狀分析論文12-01
我國個人信貸消費的現狀分析論文04-06
專利數據挖掘的論文06-26
科研管理中數據挖掘技術的應用論文10-21
高校管理中數據挖掘技術的研究論文01-15