優質論文代寫
首頁   論文定制   論文購買   論文代寫   論文發表   服務報價   信譽保證   關于優質   付款方式   聯系我們   合作加盟   網站地圖
論文搜索更方便   熱門標簽:工程論文  建筑論文  土木論文 
論文內容 您正在瀏覽主頁 > EI論文 > 正文

基于網格的聚類方法研究

日期:2013-08-07 18:28:35 來源:www.078045.live 作者:優質論文網

摘要:已有的聚類算法對于發現任意形狀的聚類和處理離群點效果不理想,分析了現有基于網格的聚類算法。使用網格方法的數據分析方法將空間劃分為由(超)矩形網格單元組成的網格,然后在網格單元上進行聚類。最后,總結全文并提出基于網格的聚類需要進一步研究的方向。
  關鍵詞:數據挖掘;網格;聚類
  
  1 引言
  數據挖掘是指從大型數據庫或數據倉庫中提取隱含的、未知的及有應用價值的信息或模式。它是數據庫研究中的一個很有應用價值的領域,融合了數據庫、機器學習、統計學等多個領域的理論和技術[1]。
  聚類分析是數據挖掘中廣為研究的課題之一,是從數據中尋找數據間的相似性,并依此對數據進行分類,從而發現數據中隱含的有用信息或知識。目前已經提出了不少數據聚類算法,其中比較著名的有CLARANS[2]、BIRCH[3]、DBSCAN[4]和CLIQUE[5]等。但對于高維、大規模數據庫的高效聚類分析仍然是一個有待研究的開放問題。
  網格方法是空間數據處理中常用的將空間數據離散化的方法?;诰W格的聚類算法由于易于增量實現和進行高維數據處理而被廣泛應用于聚類算法中。研究人員已經提出了很多基于網格的聚類算法,包括STING[6],它利用了存儲在網格單元中的統計信息;WaveCluster[7]它用一種小波轉換方法來聚類數據對象;CLIQUE在高維數據空間中基于網格和密度的聚類方法等。
  本文對已有的基于網格的聚類算法進行了研究,從網格的表示,劃分網格單元的方法,到統計網格內信息,搜索近鄰網格單元,聚類超過指定闕值的網格單元的各個步驟進行了分析,最后對基于網格方法聚類的研究方向做了展望。
  
  2 網格的定義與劃分
  網格的基本概念,設A1, A2,…, Ar 是數據集O={O1, O2,…, On }中數據對象的r 個屬性的有界定義域,那W=A1 ×A2 ×…×Ar 就是一個r 維空間, 將A1,A2 ,…, Ar 看成是W 的維( 屬性、字段),則對于一個包含n 個數據點的r 維空間中的數據集O={O1 , O2 ,…, On },其中Oi ={Oi1 , Oi2 ,…, Oir }( i=1, 2,…, n) , Oi 的第j 個分量Oij ∈Aj 。將W的每一維M等分,即把W分割成個網格單元。
  基于網格聚類算法的第一步是劃分網格結構,按搜索子空間的策略不同, 主要有基于由底向上網格劃分方法的算法和基于自頂向下網格劃分方法的算法。
  2.1 由底向上的劃分方法
  由底向上的網格劃分方法按照用戶輸入的劃分參數(即每維段數ki,1 ≤i ≤d),將數據空間均勻劃分為相等大小的網格單元,假設落入同一網格單元內的所有數據點都屬于同一個簇,每個網格單元保存落入其內數據的統計信息,比如數據點個數,數據點之和。包含一定數目數據點的網格單元被稱為高密度網格單元。
  WaveCluster與CLIQUE是采用由底向上網格劃分方法的代表性算法。WaveCluster處理低維空間數據,它的性能超越了BIRCH、CLARANS,與DBSCAN等優秀的聚類算法[15]。CLIQUE考慮了高維子空間聚類,但它的時間復雜度較高,需要用戶指定全局密度閾值。算法MAFIA[8]對CLIQUE進行了改進,為了減少聚類算法需要處理的網格單元數目,MAFIA將均勻劃分網格中每一維上數據分布密度相似的相鄰段合并,由此得到一個不均勻劃分的網格。這個網格在數據分布較均勻的區域劃分粒度大,在數據分布不均勻的區域劃分粒度小,這種不均勻劃分網格的方法能夠提高聚類的質量,被后續的許多算法所采用。
  采用由底向上的網格劃分方法的優點在于,它能通過對數據的一遍掃描,將數據壓縮到一個網格數據結構內,并基于這個網格數據結構,發現任意形狀的簇。此外,如果網格單元的粒度較小(即體積較小),那么得到的聚簇的精度較高,但是算法的計算復雜度較大。此外,由底向上的網格方法存在不適合處理高維數據的問題。在高維空間,數據的分布是非常稀疏的,網格方法失去其壓縮作用,而且屬于同一個簇的高密度網格單元也可能不相連,這使聚類算法不能發現合理數目的簇。
 



  論文代寫聯系我們

代寫QQ:論文代寫95853629
發表QQ:論文代寫1525702242
售前電話:15208306686
咨詢電話:18628191790
售后服務QQ:論文代寫
1743307994
售后服務電話:15208306686
論文代寫老師加盟或合作唯一QQ
論文代寫95853629
郵箱:[email protected]
地址:成都市一環路南一段24號(臨四川大學)

論文代寫網 碩士論文 職稱論文
  推薦論文
· 鐵水包車設計
· 電子科技大學工程碩士電力公司公務用車車輛管理系統的設計與實現
· 電子科技大學工程碩士論文聯合指導教師簡況表
· 電子科技大學工程碩士在職碩士論文答辯及提交資料(論文寫作及答辯注意事項)
· 非全日制專業學位碩士研究生論文題目變更申請表
· 四川大學工程碩士在職碩士論文答辯及提交資料(論文寫作及答辯注意事項)
· 新疆哈密三塘湖綜合能源基地產業發展規劃
· 哈密三塘湖綜合能源基地產業空間布局項目研究
· 哈密三塘湖綜合能源基地產業空間布局項目研究
· 哈密三塘湖綜合能源基地產業空間布局項目研究

  最新論文(期刊)
· 關于在我國設立建筑學專業學位的
· 鐵水包車設計
· 資深編輯教你旅游管理論文課題選題技巧
· 高校學生社團管理系統的設計與實現之軟件工程分析
· 工程管理畢業論文范文修改怎么做好?
· 專業碩士論文代筆價格(市場標準)
· 常用論文提綱模板推薦
· 畢業論文提綱模板兩篇
· 不同類型畢業論文提綱寫作指南
· 畢業論文大綱如何擬寫
· 2019年最新碩士畢業論文格式(以北京大學為例)
網站主頁  |     網站簡介  |  本站郵箱:[email protected]
在線咨詢QQ論文代寫95853629 在線咨詢QQ論文代寫1743307994 在線咨詢QQ論文代寫1525702242 咨詢電話:QQ 95853629
Copyright © 2002-2011 畢業論文代寫網 - 碩士論文 - 代寫論文 | 發表論文機構
如果您喜歡本站請將本站推薦給您5位QQ好友!牢記本站網址http://www.078045.live
國家信息產業部備案號:蜀ICP備11009426號-1
有啥手游可以赚钱 武汉赖子麻将官网 全天pk10最精准2期计划 山西十一选五任五遗漏 台湾快乐8开奖记录 网上炒股开户流程 快3开奖江苏 信誉好的棋牌游戏有哪些 澳洲五分彩走势图 内蒙古11选五走势一定牛 今晚出什么生肖的图片