Changes between Version 16 and Version 17 of adherelinux/cocluster


Ignore:
Timestamp:
Aug 24, 2010, 2:15:45 PM (14 years ago)
Author:
adherelinux
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • adherelinux/cocluster

    v16 v17  
    1313一個特別的模糊雙分群.[[br]]
    1414
    15 藉著執行雙分群,文件與文字是同時分類成數個分群.每一個雙分群是由一對高度相關文件分群與文字分群所構成.雙分群提供一些[[br]]
    16 如維度的減少,文件分群的解釋,和精準度的改善.Fuzzy雙分群更進一步使用屬性函數改善分群的重疊,這些優越使得Fuzzy分群[[br]]
    17 適合分類文件,特別運用在網際網路上.[[br]]
     15藉著執行雙分群,文件與文字是同時分類成數個分群.每一個雙分群是由一對高度相關文件(document)分群與文字(word)[[br]]
     16分群所構成.雙分群提供一些如維度的減少,文件分群的解釋,和精準度的改善.Fuzzy雙分群更進一步使用屬性函數改善分群的重疊[[br]]
     17,這些優越使得Fuzzy分群適合分類文件,特別運用在網際網路上.[[br]]
    1818
    1919數個fuzzy雙分群的演算法已先前出版(Frigui and Nasaoui,2004;Kummamuru et al.,2003;Oh et al.,2001)[[br]]
     
    3232dij:加權函數(類似正規化) [[br]]
    3333[[Image(aggregation.jpg)]] 把這項稱之為聚集度(由oh et al 2001所稱呼),dij這個項目是與document i and word j有相互關係[[br]]
    34 主要我們是想要文件與文字進入相同的(co-cluster)雙分群,而這邊告訴我們當dij值高而uci and vcj有會有高值[[br]]
     34主要我們是想要文件與文字進入相同的雙分群(co-cluster),而這邊告訴我們當dij值高而uci and vcj有會有高值[[br]]
    3535在這邊最大的聚合度有兩個相依的限制[[br]]
    3636
     37[[Image(uci.jpg)]][[br]]
     38[[Image(vcj.jpg)]][[br]]
     39(3)式子中全部文件的屬性在co-cluster中等於1(4)式子中全部的文字的屬性在co-cluster中等於1,經過這兩個限制條件後,可以保證產生fuzzy [[br]]
     40document and word clusters
     41R這一項主要是避免產生一個fuzzy co-cluster構成全部的documents and words,
    3742