最新生命統計學(Modern Statistics for the Life Sciences)

228L-001C/9789861263496

ISBN
9789861263496
作者/出版社
*鍾佳容 / 合記
出版年代/版次
2006/1

定價NT$ 600
NT$ 540
數量

頁數:351    裝訂:平裝  開數:16K  印刷:黑白

圖:152 
表:43
方塊表:157

簡介:
「最新生命統計學」採不同以往的方式教導統計學,主要針對大專院校生命科學的學生,當然也對研究生極實用,它提供GLMs紮實的觀念,以模式方程式、一般線性模式等實用的方法及利用圖表解釋主要觀念,讓學生初次接觸就上手,依照本書方法學會統計語言。電腦的進化也讓學生統計操作上不再遙不可及--本書將一一滿足這些需求。

本書特色
(Why use this book)
為什麼要學這本統計書?原因有五個。
它想要教你一種語言,一種你可以與統計溝通的語言,你可以每天告訴電腦你想做哪一種檢定,你也會用同樣的語言與統計前輩討論該怎麼做、可以怎麼做、應該怎麼做。這就是模式方程式 (model formulae) 的語言,它是在1960年代統計理論學家發展出來的,而今日已被統計學家廣泛使用。常用的統計套裝軟體也都有模式方程式的指令,所以對統計學者而言也是一個可有效學習的語言。本書就是要教你這種語言。
模式方程式的語言是有龐大的觀念為後盾的,即所謂的一般線性模式(General Linear Model或GLM),它包含所有常用的母數統計,像t檢定、變異數分析、對比分析、線性迴歸、複迴歸、共變數分析、多項式迴歸等。以往我們總是個別學習這些檢定方法,這些看似有點雷同卻又各自隱藏玄機的方法,而本書將會教你一個單一卻一致的架構,讓你一招半式也能走遍天下。以往總會莫名其妙的來個「特例」,如今本書將提供你一個完整的意義。這樣將能滿足你的統計腦袋,不過實務操作上還有兩點可助你一臂之力,除了更好記之外,透過一些方法能在同樣的時間裡卻能處理更多的資料。學習也將加速!
統計參考書一般分為兩類:似工具書(給那些想要做卻不了解的)與專給情報觀念的,很多作者所面臨的問題是為什麼總是利用數學證據來解釋檢定方法,但事實上對統計學者而言,數學並不會每天都會用到,對大多數的統計使用者而言,更是有敬而遠之之感。有鑑於此,本書選用一種有別於數學的解釋方法,卻也能將新語言與觀念相結合的方法,比如利用幾何學圖像方法來解釋一般線性模式是如何運作的,這些方法與觀念也是統計使用者應該知道的,把學習的時間花在刀口上也是很重要的。
假如你是一位學生,總是按照傳統的方式學習,那你很有可能有過這樣的經驗,設計一個實驗或調查時,你會發現統計課總是不會包羅萬象地含括任何你所想做的分析,所以你去向你的統計前輩求救,前輩不是告訴你:「用這個比較簡單的方法去做,即便它不怎麼合適」就是跟你說「把資料給我,我來幫你做」,或許我們會很喜歡第二種回答,但最好還是要能知道該如何親自動手!一般線性模式的魔力、模式方程式的運用等本書所提供給您的基本技巧,你絕對有絕佳的能力來親自分析你自己的資料!
雖然一般線性模式不會橫跨所有的統計,但最後一個學習本書的理由就在於此書的觀念架構幾乎可以原封不動的轉成一般化線性模式 (Generalised Linear Models),這些就含括了邏輯迴歸、收益迴歸、對數線性迴歸等等。所以假如此時你只想學初等統計,那本書將能滿足你,假如你想要更進一步學習,你也將準備就緒,換句話說,你也已經具有學習一般化線性模式的野心,雖然仍缺數學技巧或技術上的準備,但至少你已從本書獲得一般線性模式的主要觀念了,就等著揚帆前進了。
要告訴讀者很重要的一件事就是本書並未討論很多種的分析方法,這些主要的課程不是太簡單就是太複雜,無母數分析不隸屬於一般線性模式,所以假如你的資料總是簡單到用無母數即能處理,那你還是用無母數就好,但做這些檢定時也有一些危險要特別注意,例如當你想改用較精緻的檢定時就無擇了。舉個例來說,變項的統計削減是有很多限制的,而無母數統計的估計其實是很狡猾、無很多理論根據的。
有些檢定是太過複雜,就如剛剛所提到的,那些需套用一般化線性模式的檢定。其他還有像因素分析、主成分分析與時間序列分析等,雖然它們也都是依據簡單的一般線性模式,但本書不會提到,不過本書所提供的技巧與觀念將能幫助你在接觸這些較複雜的檢定之前,有萬全的準備。
在牛津大學,我們用本書當作生物學系大一大二學生的教科書,已經十個年頭了,全球對於本書的興趣,讓我們對這本教科書深具信心,本書也企圖能將一般線性模式的觀念推廣到全球生物科學系的大學生,盡一份心力。
閱讀手則
假如你覺得自己的基本統計不夠好,本書特地於書末開闢了複習篇,簡短的回顧一些重點,來幫你重拾記憶。假如你有任何閱讀上的問題,你可參照初等統計書籍(例如Myra Samuels的生命科學統計 (Statistics for the life sciences),由Maxwell-Macmillan出版,或其他參考書目所列的建議書籍),裡頭都有詳細解說。本書的目標是要呈現重要基本的統計觀念,並沒有硬性規定適用哪一種套裝軟體,而不論是Minitab、SAS或SPSS,其所附的附件會提供所有有關統計執行的資訊,而本書中的「方塊」僅呈現統計輸出報表的一般格式,在附件裡,也會有些同樣分析卻有著特別的輸出形式的介紹。本書所有的資料檔都可在網站上得到,所以讀者可以自行嘗試跑報表。
學統計,第一個會碰到的原則就是當我們想要比較兩個組別時,卻無法簡單計算出其間的差異;算出兩組是如何變異的也是很重要的。變異程度是主要能夠判斷兩個平均值是來自不同母群體的關鍵,我們就是要討論像這樣隱藏在統計方法背後的原則。我們不會一直都在做簡單的兩組比較,甚至常會是不同的變項在好幾種不同程度的比較,所以我們必須將原則擴展到能含括一次完成所有變項的比較,為何我們不能只用一些我們已經知道的簡單檢定(例如t檢定)來做兩兩比較呢?
這個答案在於簡單t檢定所得到的p值(請見複習篇),每次我們做一個檢定會得到一個小於0.05的p值,也因此我們可以說兩組有達到統計上的差異,但事實上,我們並無法保證它們是真的不同,也無法有絕對的保證──兩組樣本總是有可能會因機會造成,讓此兩組從同樣母群體的兩種極端被選取出來。只不過習慣上,機率的閥值我們定為0.05,換句話說,我們準備接受犯錯的機率是0.05,這是我們認為可以接受的風險。而假如我們執行了一連串的兩兩配對,每次檢定也都會帶來0.05的犯錯風險,即使是三組平均值的比較,我們也必須做三次的兩兩比較,四組平均值的比較,也須做六次的兩兩比較,以此類推,犯錯的風險急速增加,超出我們可接受的範圍。假如所有的比較能有效的一次完成,那將是最省事的,我們也比較能得到一個合理的結論,也能利用更多的資訊來下結論。
我們在發展主題時,常常需要同時考慮好幾個變項,我們可以利用較簡單的問題「這兩組是不同的嗎?」來調查更有趣、更微妙的假設,並偵測我們的資料型態是否有未考量齊全的地方。舉個例來說,我們不會只問「肥料會影響農作量嗎?」而是「肥料對農作物的影響是因為灌溉而產生的嗎?」;另一個例子是我們不會只對這個有興趣「懷孕期間喝咖啡會影響寶寶的出生體重?」,而是「孕婦喝咖啡對寶寶體重的影響會高於或低於抽菸對寶寶體重的影響?」這樣的好處在你親身體驗過後會更明顯。
每個章節後面都有練習題,答案在本書後面,所有資料檔的指定名稱都將以楷體及斜體表示,你也可在網站上找到,每個資料檔會有一些變項,以大寫標出,一些關鍵字或觀念在第一次出現時,也會以粗體字呈現,以利讀者閱讀。

教書手則
本書所有的素材都會以方塊(就像表一樣)呈現,方塊即從統計套裝軟體來的一般規格。在統計套裝軟體附件裡,你也可發現我們的網站 (http://www.oup.com/ grafenhails/),裡頭有所有有關Minitab、SAS、SPSS的解釋,有需要的話,未來還需要更進一步的文字解說,這些附件你可用PDF檔下載;另外,如果你想要用本書當做中等程度的統計課程基礎的話,那每一個章節可能約需一堂授課與一堂上機練習(所以約兩小時)。
感謝
本書所引用的資料庫來自許多地方,包括Minitab「樹木 (trees)、「可賣的木材 (merchantable timber)」、「祕魯 (Peru)」、「年級 (grades)」、「馬鈴薯 (potatoes)」、J.F. Osborn (1970) 醫學研究的統計練習 (Statistical Exercises in Medical Research),由Blackwell科學出版(「解毒劑 (antidotes)」)、N. Draper & H. Smith (1981) 應用迴歸分析第二版 (Applied Regression Analysis),由Wiley Interscience出版(「特殊密度 (specific gravity)」)、The Correspondence of Charles Darwin第6卷(F. Burkhardt & S. Smith編輯,劍橋大學出版,1990) (「達爾文 (Darwin)」)、Myra Samuels (1989) 生命科學統計 (Statistics for the life sciences),由Maxwell-Macmillan出版,(「種子 (seeds)」),有些資料檔的來源因失傳多年,不及備載。
我們也藉由這個機會感謝所有幫助這本書完成的朋友,還有以它做為課堂教科書的同好,尤其是Robin McCleery的幫助甚多,課程的發展、統計上的、組織上的與打字部分,相信這在早期是相當難得的。還有感謝自1990開始,所有參與此套課程與上機的老師與學生,還要感謝OUP的夥伴們,另外我們要特別提的是Michael Rodgers,自從1994就開始不吝對本書指導建議,讓本書能茁壯滋長。最後,自從著手寫本書之際,我們兩位作者就結婚了,所以在此也要特別感謝我們的另一半Elizabeth Fallaize與Peter Greenslade的協助。

牛津
正月 2002 A.G
R.H

目錄(Contents)
本書特色 ix
 閱讀手則 xi
 教書手則 xii
1 變異數分析 1
1.1 模式方程式與幾何圖像 1
1.2 一般線性模式 1
1.3 變異數分析 (ANOVA) 的基本原理 2
1.4 ANOVA的例子 10
1.5 ANOVA的幾何學方法 16
1.6 摘要 19
1.7 練習 20
2 迴歸分析 22
2.1 何種資料適合用迴歸? 22
2.2 如何挑選最適直線? 23
2.3 迴歸的幾何學方法 26
2.4 迴歸的例子 28
2.5 信賴區間與預測區間 33
2.6 迴歸分析的結論 35
2.7 不尋常的觀察值 40
2.8 X與Y的角色─互換有關係嗎? 43
2.9 摘要 45
2.10 練習 45
3 模式、參數與一般線性模式 (GLMs) 47
3.1 母群體與參數 47
3.2 以線性方程式來表達所有模式 48
3.3 轉換表與檔案設計 52
3.4 摘要 55
3.5 練習 55
4 一個以上的解釋變項 56
4.1 為什麼要使用一個以上的解釋變項? 56
4.2 殘差的消減 59
4.3 兩種平方和 61
4.4 城市的狐狸──統計消減的例子 65
4.5 統計消減的幾何概念 68
4.6 摘要 72
4.7 練習 73
5 實驗設計─越簡單越好 76
5.1 實驗設計的三個基本原則 76
5.2 區塊化:以幾何學方法說明 85
5.3 正交性 (orthogonality) 概念 88
5.4 摘要 92
5.5 練習 93
6 連續與類別變項同時出現 96
6.1 到目前為止所出現的模式 96
6.2 連續與類別變項同時出現 97
6.3 連續與類別變項的正交性概念 102
6.4 連續與類別變項的處理 104
6.5 一般線性模式的特性 106
6.6 摘要 107
6.7 練習 108
7 交互作用─較複雜的情況 110
7.1 要因原則 110
7.2 要因實驗分析 112
7.3 交互作用是什麼意思? 115
7.4 結果呈現 117
7.5 延伸交互作用的觀念到連續性變項 127
7.6 交互作用的使用 132
7.7 摘要 134
7.8 練習 134
8 模式檢查Ⅰ:獨立性 136
8.1 異質性資料 137
8.2 重複測量 142
8.3 巢狀資料 147
8.4 偵測非獨立 148
8.5 摘要 151
8.6 練習 151
9 模式檢查Ⅱ:其他三種假設 153
9.1 變異數的同質性 153
9.2 誤差呈常態 155
9.3 線性∕加成性 157
9.4 模式評論與解決方法 157
9.5 預測賣得出去的木材產量:模式評論的例子 173
9.6 轉換的選擇 178
9.7 摘要 180
9.8 練習 181
10 模式選擇I:模式選擇的原則與實驗設計 186
10.1 模式選擇所面臨的問題 186
10.2 模式選擇的三原則 189
10.3 模式選擇的四大問題 195
10.4 正交或近似正交設計的實驗 196
10.5 尋找類別變項的資料趨勢 201
10.6 摘要 205
10.7 練習 206
11 模式選擇II:多個解釋變項之資料分析 209
11.1 複迴歸的「變項經濟性」考量 210
11.2 複迴歸的p值累乘性 217
11.3 自動化模式選擇的過程 220
11.4 賞鯨─一般線性模式分析的例子 225
11.5 摘要 228
11.6 練習 229
12 隨機效應 232
12.1 什麼是隨機效應? 232
12.2 處理隨機效應的四個新觀念 234
12.3 有一個隨機因子的單因子變異數分析 (one-way ANOVA) 238
12.4 兩層巢狀變異數分析 (A two-level nested ANOVA) 241
12.5 隨機與固定效應都存在 244
12.6 模擬分析 247
12.7 摘要 252
12.8 練習 253
13 類別資料 255
13.1 類別資料:基本概念 255
13.2 波以松分布 258
13.3 列聯表的卡方檢定 265
13.4 一般線性模式與類別資料 269
13.5 摘要 278
13.6 練習 279
14 更深一層的涵義 281
14.1 廣義線性模型 281
14.2 多重y變項、重複測量與個體內因素 283
14.3 結論 284
15 練習題答案 285
第一章 285
第二章 287
第三章 288
第四章 289
第五章 292
第六章 294
第七章 295
第八章 298
第九章 299
第十章 308
第十一章 310
第十二章 313
第十三章 314
複習篇:基礎觀念 317
R1.1 母群體和樣本 317
R1.2 三種型式的變異量:樣本、母群體和估算 318
R1.3 信賴區間:表達不確定性的方法 322
R1.4 虛無假設-採取保守態度 324
R1.5 兩個平均值的比較 327
R1.6 結論 331

附錄一 p-values的意義與信賴區間 332
附錄二 樣本平均值的變異數分析結果 335
附錄三 機率分布 339
參考文獻 343
索引 345