Changes between Version 16 and Version 17 of adherelinux/cocluster
- Timestamp:
- Aug 24, 2010, 2:15:45 PM (15 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
adherelinux/cocluster
v16 v17 13 13 一個特別的模糊雙分群.[[br]] 14 14 15 藉著執行雙分群,文件與文字是同時分類成數個分群.每一個雙分群是由一對高度相關文件 分群與文字分群所構成.雙分群提供一些[[br]]16 如維度的減少,文件分群的解釋,和精準度的改善.Fuzzy雙分群更進一步使用屬性函數改善分群的重疊,這些優越使得Fuzzy分群[[br]]17 適合分類文件,特別運用在網際網路上.[[br]]15 藉著執行雙分群,文件與文字是同時分類成數個分群.每一個雙分群是由一對高度相關文件(document)分群與文字(word)[[br]] 16 分群所構成.雙分群提供一些如維度的減少,文件分群的解釋,和精準度的改善.Fuzzy雙分群更進一步使用屬性函數改善分群的重疊[[br]] 17 ,這些優越使得Fuzzy分群適合分類文件,特別運用在網際網路上.[[br]] 18 18 19 19 數個fuzzy雙分群的演算法已先前出版(Frigui and Nasaoui,2004;Kummamuru et al.,2003;Oh et al.,2001)[[br]] … … 32 32 dij:加權函數(類似正規化) [[br]] 33 33 [[Image(aggregation.jpg)]] 把這項稱之為聚集度(由oh et al 2001所稱呼),dij這個項目是與document i and word j有相互關係[[br]] 34 主要我們是想要文件與文字進入相同的 (co-cluster)雙分群,而這邊告訴我們當dij值高而uci and vcj有會有高值[[br]]34 主要我們是想要文件與文字進入相同的雙分群(co-cluster),而這邊告訴我們當dij值高而uci and vcj有會有高值[[br]] 35 35 在這邊最大的聚合度有兩個相依的限制[[br]] 36 36 37 [[Image(uci.jpg)]][[br]] 38 [[Image(vcj.jpg)]][[br]] 39 (3)式子中全部文件的屬性在co-cluster中等於1(4)式子中全部的文字的屬性在co-cluster中等於1,經過這兩個限制條件後,可以保證產生fuzzy [[br]] 40 document and word clusters 41 R這一項主要是避免產生一個fuzzy co-cluster構成全部的documents and words, 37 42