星期六, 7月 15, 2006

Special Topics - 1

                                       
Meeting 那天, 輕台來襲  
                                     
儘管颱風走了, 台灣附近的雲層還是很濃厚.
   
這禮拜輕度颱風來襲, 雖然事後證明它的來臨對生活沒有影響, 但事前也沒料到它的強度, 因此家人也要我待在家中顧家, 儘管全台灣幾乎還是照常上班上課的 。。。 Meeting 也就漏了一次
對 Social NetWork 有了小小的了解之後, 接著我想對手中已經掌握的大約 20 篇 paper作個分類. 藉由題目以及 Abstract 我把它們要解的問題大約分成了幾類 :

-
About Link : 看一個 Link 是不是有存在的必要, 可以達到簡化 graph 的功效 ; 看 Graph 中的各個 Node 是不是隱含有其他的Interaction. 
-About SubGraph : 關於 Community 的議題, 例如找 Graph 中的community ; 或是在 Graph 中尋找關於某些特定條件的 SubGraph 的議題.
-Search : 把 Node 作Rainking.
-Classify : 把 Graph 分類.
-Mining From : 這個部份的就比較模糊了, 可能會和其他的部分有 Over Map, 主要是探討從不同種類的 Graph 或是 資料中去 Mining. 至於 mining 的目的, 大概要再去詳讀 paper 來了解.

在稍加分類之後, 再去閱讀了 SIGKDD 2005 Vol.7 裡面有一篇 Link Mining : A Survey. 發現文中的分類就比我大略分出來的好上許多.

它先提到了關於 Data Representation 的部份, 這個部份在 Link Ming 是很重要的, 要表現的東西可能可以由很多種不同的圖來表示, 譬如 G 可以經由某種轉換變為 G', 它們所蘊含的內容是一樣的, 但是對於每種不同的主題, 就得要找一種最適合的來表示, 否則可能對於準確度或是方便性都會有影響.

接著他對 Link Mining 的分類如下(Copy From The Paper) :
1. Object-Related Tasks
  (a) Link-Based Object Ranking
 (b) Link-Based Object Classi cation
 (c) Object Clustering (Group Detection)
 (d) Object Identi cation (Entity Resolution)
2. Link-Related Tasks
 (a) Link Prediction
3. Graph-Related Tasks
 (a) Subgraph Discovery
 (b) Graph Classi cation
 (c) Generative Models for Graphs
這樣的分類結果, 的確就讓人感覺清楚多了.

可以發現, 原本我的分類跟這個分類有些類似之處. 但是我又遺忘了 Classify 與 Cluster 是有分別的. 它也把問題的分類的分成比較令人清楚的程度(至少比我的還要清楚) : 它是分別探討了 Node / Link / Graph這上面的議題, 而我一時間是把它們雜在了一起.

接著, 我想到我有 Jiawei Han 的 Data Mining 課本最新板本(2nd Edition)裡面新增的 第九章 : Chapter 9 Graph Mining, Social Network Analysis, and MultirelationalData Mining.
老師原本說這要 "最後" 再來看, 但是我想, 到底什麼時候才是最後呢 ... 所以我就選擇先偷看了一下 ~ 我覺得這時候來看應該OK啦 ~ 畢竟我已經有 "一點點" 的了解了 XD

課本的第一節是介紹了已經發展一段時間的 Graph Mining. 接著才介紹目前比較複雜的 Social NetWork Mining 或是 MultiRelational Mining. 我嘗試迅速的閱讀每一頁裡面提到關於 WHAT 的部份, 幾個小時大概看完了一節多. 文中主要是敘述了各種相關的 Graph Mining 以及應用, 有些方法也有提到演算法之類的, 但是每種方法的篇幅都不會很多, 大概少於一頁. 裡面提到了很多利用在 化學或是生化 領域的應用, 大概目前這些領域的 Data 主要的表現方法都是 Graph 吧, 像是化學分子等等.
接著第二節也講了一些 Social Network 的特性, 也有做分類, 但是分類出來的就沒有那篇 Survey 來得清晰.

看著看著, 對於 Social NetWork 的"表面的" What, 已經是經過一次一次的補強, 大概可以"抽象"的知道有哪些, 對於老師所說要 "具體" 的了解, 還是有段差距. 至少, 還沒有辦法掌握住這些 What 背後的意義 ...

所以, 接下來還是 --- 看 Paper XD.   先依照著自己分類好的, 一堆一堆的看吧 ...
但是, 沒錯" ... 進度上, 時間已經慢上許多了 XD  Meeting 前要先了解個 3,5 篇才行呢.

感覺看了一些東西了, 也以為是如此.
但是回頭一望, 卻又發現 ... 根本什麼也沒看 ~"~

Related Link :
Data Mining: Concepts and Techniques, 2nd ed.
(Jiawei Han and Micheline Kamber)
http://www-sal.cs.uiuc.edu/~hanj/bk2/

Link Mining : A Survey.
(From :
SIGKDD , December 2005, Volume 7, Issue 2.)

沒有留言:

張貼留言