2012年5月24日 星期四

Collaborative Information Behavior


2012-0524(閱讀)
Zhen Yue, Daqing He. "A Model for Understanding Collaborative Information Behavior in E-Discovery", Text REtrieval Conference (TREC) 2009, from
http://trec.nist.gov/pubs/trec18/papers/pitt_sis.legal.pdf

摘要
 2009, 作者參與一個TREC法律追溯檢索的互動研究任務
作者,設計了一實驗,來調查研究一群檢索者透過
協作資訊行為(以下簡稱CIB)進行數位化資料蒐證
透過本研究,作者試圖提出一個模型來幫助我們理解,
協作資訊行為進行數位化資料蒐證過程。


 E-Discovery 在法律相關學域指的是電子儲存資料的蒐證相關的程序和原則
 e-Discovery 在資訊科學上可譯為電子化搜尋、數位資料搜尋
「美國於2006年11月修法通過電子蒐證法(E-Discovery),即針對「電子儲存資訊」ESI(Electronically Stored Information)定義了法律認定的相關發現程序和原則,而其中數位化電子資源已被認定為日趨重要的蒐證資料」



2012-0529(計畫閱讀)
Shah, C. (2008). Toward collaborative information seeking (CIS). Retrieved June 20, 2008, from http://workshops.fxpal.com/jcdl2008/submissions/tmpE1.pdf

2012-0531(計畫閱讀)
Yue, Zhen, Daqing He. Exploring Collaborative Information Behavior in Context: A Case Study of E-discovery. In the proceedings of 2nd International Workshop on Collaborative Information Seeking, a workshop of the 2010 ACM conference on Computer Supported Cooperative Work. 2010.
http://www.mendeley.com/research/exploring-collaborative-information-behavior-context-case-study-ediscovery/

2012年5月6日 星期日

t 檢定 ( t test)


獨立 t 檢定的概念 (Independent t Test)
適用時機:
如果想要比較一組樣本的平均值和某一特定值間之差異 (one sample test),或是兩組樣本的平均值間是否存在差異 (two sample test),且其對應值是連續 (continuous),則使用獨立 t 檢定。


用法:檢測假說 (Hypothesis testing)

獨立 t 檢定主要在於比較兩組樣本間的平均值是否存在差異,可視為變異數分析 (ANOVA) 的特例 -- 兩組檢測。

one sample test: 檢測其樣本平均值與母群體平均值 (某特定數值) 是否不同。其虛無假設為 H0:Xmean = m
two sample test: 檢測兩組樣本平均值之差值 (某特定數值) 是否不同。其虛無假設為 H0:Xmean1 = Xmean2

前提假設

⊙ 相依變項 (dependent variable) 的本質必須是連續變數 (continuous variable),且是隨機樣本 (random sample),亦即是從母群體 (population) 中隨機抽樣而來。如果不是連續數,則必須採用無母數分析 (nonparametric test)。
⊙ 相依變項的母群體必須是常態分佈 (normal distribution)。此可藉由 proc univariate 來檢測,參考「常態分佈」說明。若檢測結果不是常態分佈,則不可使用獨立 t 檢定,並須改為無母數分析
⊙ 其樣本的量測皆為獨立事件 (independent event),亦即獨立變項 (independent variable) 只有一或兩組,且第一組的樣本和第二組的樣本不會相互影響。例如性別 (gender):如果樣本是男性一定不會影響樣本是女性的量測。
⊙ 如果不是獨立事件,則應該採用配對 t 檢定。
⊙ 兩組的樣本之變異數 (variance, s) 亦為常態分佈,且為常數 (constant)。如果不是,則其統計值 t 必須調整。

參見:
http://www.pt.ntu.edu.tw/hmchai/SAS/SAScontinuous/SASttest.htm

http://web.ydu.edu.tw/~jessica/rm/mysite/new_page_9.htm