So sánh 2 tỉ lệ trong Stata

Thống kê phân tích biến số định lượng với Stata

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây [429.8 KB, 27 trang ]

Thống kê phân tích biến số định lượng với Stata
Sơ lược lí thuyết về so sánh 2 trung bình
Kiểm định t dùng để so sánh 2 trung bình của của biến số định lương có phân phối bình
thường. Kiểm định t gồm có [a] Kiểm định t bắt cặp để so sánh trung bình trước và sau
khi can thiệp trên một nhóm và [b] kiểm định t không bắt cặp để so sánh trung bình của 2
nhóm độc lập.
Có hai loại kiểm định t không bắt cặp [khi so sánh trung bình của 2 nhóm độc lập]. Kiểm
định t có giả định 2 phương sai bằng nhau và kiểm định t không có giả định phương sai
bằng nhau. Hai loại kiểm định này có chung nguyên lí nhưng khác nhau trong cách tính
toán độ tự do [của kiểm định t] và cách tính sai số chuẩn.
Kiểm định t không bắt cặp giả định 2 phương sai bằng nhau
Kiểm định t không bắt cặp giả định 2 phương sai bằng nhau dùng để so sánh trung bình
của 2 nhóm độc lập và đòi hỏi 2 giả định.
- Các giá trị của biến số của cả 2 dân số có phân phối bình thường
- Ðộ lệch chuẩn ở 2 nhóm dân số là bằng nhau.
Nếu chúng ta kí hiệu:
x1
: giá trị trung bình ở nhóm 1
x2
: giá trị trung bình ở nhóm 2
n1
: cỡ mẫu của nhóm 1
n2
: cỡ mẫu của nhóm 2
2
s1
: phương sai ở nhóm 1
2
s2
: phương sai ở nhóm 2
Chúng ta có thể xác định độ tự do, sai số chuẩn và giá trị của thống kê t theo công thức


sau:
- Độ tự do của kiểm định t: df = n1 + n2 - 2
- Sai số chuẩn:
sp =

se = s p 1 / n1 + 1 / n2

với

[n1 − 1] s12 + [n2 − 1] s22
[n1 − 1] + [n2 − 1]
t=

x1 − x2
x1 − x2
=
se
s p 1 / n1 + 1 / n2

- Giá trị thống kê t:
Sau khi tính được giá trị thống kê t, người ta tra bảng phân phối t với [n1 +n1 - 2] độ tự
do và tính được xác suất p. Thông thường nếu p 0
t = -3.2654
P > t =
0.9994

Trả lời: Trẻ trai có trọng lượng sơ sinh trung bình là 3211.28 gram, của trẻ gái là
3044.13 gram. Với giá trị t = 3,2654 và mức ý nghĩa [p-value] là 0.0012 chúng ta kết luận
có sự khác biệt về trọng lượng sơ sinh giữa trẻ trai và trẻ gái [p=0.0012].
6. Hãy so sánh trọng lượng sơ sinh của con bà mẹ tăng huyết áp và bà mẹ không tăng
huyết áp.
Hướng dẫn: Theo giải thuật được trình bày ở đầu chương, để so sánh trọng lượng [biến
phụ thuộc có phân phối bình thường] ở 2 nhóm trước tiên chúng ta cần phải xem phương
sai của 2 nhóm mẹ tăng huyết áp và mẹ không tăng huyết áp có bằng nhau hay không.
Nếu phương sai 2 nhóm tương đương chúng ta có thể sử dụng t-test thông thường [t-test
phương sai đồng nhất]. Nếu phương sai 2 nhóm không tương đương, chúng ta phải sử
dụng t-test phương sai không đồng nhất hay kiểm định phi tham số.
Kiểm định 1: So sánh 2 phương sai
Để so sánh trung bình của một biến định lượng ở hai hay nhiều nhóm, chúng ta sử dụng
menu Statistics :: Summaries, tables, & tests :: Classical tests of hypothesis :: Group
variance comparison test.
Sau khi cửa sổ sdtest - Group variance comparison test chúng ta đưa biến tlsosinh vào


hộp văn bản Variable name và biến tang_ha vào hộp văn bản Group name variable rồi
nhấp vào nút lệnh OK.
Kết quả được trình bày như sau:


. sdtest tlsosinh, by[ tang_ha ]
Variance ratio test
----------------------------------------------------------------------------Group |
Obs
Mean
Std. Err.
Std. Dev.
[95% Conf.
Interval]
--------+-------------------------------------------------------------------Ha bt |
552
3191.531
25.58435
601.0962
3141.276
3241.786
Ha tang |
89
2742.157
86.17222
812.9471
2570.908
2913.406
--------+-------------------------------------------------------------------combined |
641


3129.137
25.78336
652.7827
3078.507
3179.767
----------------------------------------------------------------------------Ho: sd[huyet ap] = sd[huyet ap]
F[551,88] observed
= F_obs
=
F[551,88] lower tail = F_L
= F_obs
=
F[551,88] upper tail = F_U
= 1/F_obs =
Ha: sd[1] < sd[2]
P < F_obs = 0.0000

Ha: sd[1] != sd[2]
P < F_L + P > F_U = 0.0003

0.547
0.547
1.829
Ha: sd[1] > sd[2]
P > F_obs = 1.0000

Kết quả cho thấy giá trị p = 0,0003 có nghĩa là phương sai của trọng lượng lúc sinh của 2
nhóm không đồng nhất. Vì vậy chúng ta không thể dùng t-test phương sai đồng nhất mà
phải sử dụng t-test phương sai không đồng nhất [kiểm định 2A] hay kiểm định phi tham
số [kiểm định 2B].


Kiểm định 2A: so sánh 2 trung bình t-test phương sai không đồng nhất
Để so sánh trung bình của một biến định lượng ở hai hay nhiều nhóm, chúng ta sử dụng
menu Statistics :: Summaries, tables, & tests :: Classical tests of hypothesis :: Group
mean comparison test [xem lại câu 4] và biến tlsosinh vào hộp văn bản Variable name;
biến tang_ha vào hộp văn bản Group name variable của cửa sổ ttest- group mean
comparison. Cần lưu ý đánh dấu vào hộp kiểm Unequal variances rồi nhấp vào nút OK.


Kết quả trình bày như sau:
. ttest tlsosinh, by[tang_ha] unequal
Two-sample t test with unequal variances
----------------------------------------------------------------------------Group |
Obs
Mean
Std. Err.
Std. Dev.
[95% Conf.
Interval]
--------+-------------------------------------------------------------------ha bt |
552
3191.531
25.58435
601.0962
3141.276
3241.786
ha tang |
89
2742.157
86.17222
812.9471


2570.908
2913.406
--------+-------------------------------------------------------------------combined |
641
3129.137
25.78336
652.7827
3078.507
3179.767
--------+-------------------------------------------------------------------diff |
449.3735
89.88999
271.1197
627.6273
----------------------------------------------------------------------------Satterthwaite's degrees of freedom: 104.069
Ho: mean[ha bt] - mean[ha tang] = diff = 0
Ha: diff < 0
t =
4.9991
P < t =
1.0000

Ha: diff != 0
t =
4.9991
P > |t| =
0.0000

Ha: diff > 0
t =


4.9991
P > t =
0.0000

Trả lời: Con bà mẹ bị tăng huyết áp có trọng lượng sơ sinh trung bình là 2742 gram, ở
con của bà mẹ không tăng huyết áp là 3192 gram. Sự khác biệt này có ý nghĩa thống kê
với p |z| =
0.0000

7. Hãy so sánh trọng lượng sơ sinh của trẻ sinh ra từ con của các nhóm nghề nghiệp khác


nhau của người mẹ.
Hướng dẫn: Để so sánh trung bình của một biến định lượng ở nhiều nhóm, chúng ta phải
sử dụng phương pháp phân tích ANOVA một chiều. Sử dụng menu Statistics ::
ANOVA/MANOVA :: oneway analysis of variance


Do chúng ta muốn phân tích tác động của yếu tố nghề nghiệp mẹ [nghenghiep] lên trọng
lượng sinh của trẻ [tlsosinh] khi cửa sổ oneway hiện lên, ta tiến hành các bước sau:
Bước 1: đặt con trỏ vào hộp văn bản Response variable
Bước 2: đưa con trỏ vào cửa sổ Variables và nhấp vào biến tlsosinh để đưa biến này vào
hộp văn bản Response Variable.
Bước 3: đặt con trỏ vào hộp văn bản Factor
Bước 4: đưa con trỏ vào cửa sổ Variables và nhấp vào biến nghenghiep để đưa biến này
vào hộp văn bản Factor.
Bước 5: Đánh dấu vào hộp kiểm Produce summary table để thể hiện thống kê mô tả trọng
lượng sơ sinh trung bình ở các nhóm nghề nghiệp
Bước 6: Đánh dấu vào hộp kiểm Scheffe để có kiểm định so sánh trọng lượng trung bình
ở từng cặp đôi nghề nghiệp khác nhau
Bước 7: Nhấp vào nút lệnh OK


Trên cửa sổ Output, trên cùng thống kê mô tả của số liệu về trọng lượng sơ sinh theo
nhóm tuổi của mẹ:
nghe nghiep |
me - 1=tu |
do, 2=cong |
Summary of trong luong so sinh
nhan, |
[gram]
3=vien chuc |


Mean
Std. Dev.
Freq.
------------+-----------------------------------tu do |
2981.4135
643.76283
104
cong nhan |
3118.084
646.69338
238
vien chuc |
3189.3177
654.19649
299
------------+-----------------------------------Total |
3129.1373
652.78265
641

Con bà mẹ nghề nghiệp tự do có trọng lượng trung bình là 2981 gram, của bà mẹ với
nghề nghiệp là 3118 gram, của bà mẹ với nghề nghiệp viên chức là là 3190 gram. Chúng
ta biết kiểm định ANOVA có thể sử dụng để kiểm định sự khác biệt về trung bình của
nhiều nhóm, nhưng trước tiên chúng ta hãy kiểm tra các điều kiện của phân tích ANOVA
là [a] biến số phụ thuộc có phân phối bình thường - điều này đã được xác nhận từ đồ thị
của trọng lượng sơ sinh và [b] phương sai của biến phụ thuộc ở các nhóm bằng nhau điều này cũng được xác nhận qua thống kê Bartlett với p-value là 0,973.
Analysis of Variance
Source
SS
df


MS
F
Prob > F
-----------------------------------------------------------------------Between groups
3381483.56
2
1690741.78
4.00
0.0187
Within groups
269338638
638
422160.875
-----------------------------------------------------------------------Total
272720122
640
426125.19
Bartlett's test for equal variances:

chi2[2] =

0.0558

Prob>chi2 = 0.973

Vì vậy trong trường hợp này kiểm định ANOVA là có giá trị. Ta đọc kết quả của bảng


ANOVA. Chúng ta có được giá trị F = 0.0187 và mức ý nghĩa [p-value] là 0.9723 chúng
ta kết luận không có sự khác biệt về trọng lượng sơ sinh ở con của những bà mẹ có nghề


nghiệp khác nhau. Với kết luận này chúng ta có thể kết luận là có ít nhất có 1 cặp đôi [2
nhóm] nghề nghiệp của mẹ có sự khác biệt về trọng lượng con nhưng chúng ta không biết
là sự khác biệt này ở cặp đôi nghề nghiệp nào. Để biết cặp đôi nào có sự khác biệt ta xem
kết xuất của so sánh sau kiểm định [post-hoc test] của Scheffe:
Comparison of trong luong so sinh [gram]
by nghe nghiep me - 1=tu do, 2=cong nhan, 3=vien chuc
[Scheffe]
Row Mean-|
Col Mean |
tu do
cong nha
---------+---------------------cong nha |
136.671
|
0.202
|
vien chu |
207.904
71.2337
|
0.020
0.451

Kết quả của kiểm định Scheffe được trình bày theo bảng và ở mỗi ô của bảng có 2 con
số: con số ở trên thể hiện sự khác biệt về trọng lượng của nghề nghiệp của hàng so với
nghề nghiệp của cột và giá trị ở dưới thể hiện giá trịi p [mức ý nghĩa] của sự khác biệt
này. Dựa vào giá trị p, có thể kết luận có sự khác biệt về trọng lượng sơ sinh của con 2
nhóm nghề nghiệp viên chức và tự do [giá trị p=0,020] và nhóm nghề nghiệp viên chức
có trọng lượng trung bình cao hơn nhóm nghề nghiệp tự do là 207,9 gram.


Nhắc lại lí thuyết về Tương quan và ước lượng
Tương quan là số đo mức độ hai biến số định lượng cùng thay đổi với nhau. Có nhiều
loại hệ số tương quan, nhưng chúng đều có giá trị từ -1 đến 1. Nếu chúng có giá trị dương
có nghĩa là hai biến số đồng biến với nhau, nếu chúng có giá trị âm nghĩa là hai biến số
nghịch biến. Giá trị tuyệt đối của hệ số tương quan càng gần một nghĩa là hai biến số có
liên hệ chặt với nhau và vai trò của sai số ngẫu nhiên sẽ ít hơn. Nếu hệ số tương quan có
giá trị bằng zero có nghĩa là hai biến số độc lập và không quan hệ gì với nhau. Khi trị
tuyệt đối của hệ số tương quan bằng một có nghĩa là hoàn toàn không có sai số ngẫu
nhiên. Bình phương của hệ số tương quan [r 2] thể hiện tỉ lệ các biến thiên của biến số phụ
thuộc có thể được giải thích bằng biến số độc lập.
Loại hệ số tương quan được sử dụng phổ biến nhất là hệ số tương quan Pearson r:
r=

∑ [ x − x ][ y − y ]
∑ [ x − x] ∑ [ y − y]
i

i

2

i

2

i

Lí giải ý nghĩa của hệ số tương quan:
- Hệ số tương quan luôn luôn nằm trong đoạn [-1,1]
- Hệ số tương quan r dương chứng tỏ hai biến số là đồng biến; hệ số tương quan r âm


chứng tỏ hai biến số là nghịch biến; hệ số tương quan bằng zero nếu hai biến không liên
hệ.
- Trị số tuyệt đối của hệ số tương quan r nói lên mức độ liên quan giữa hai biến số. Nếu
trị tuyệt đối của r bằng 1 [r=1 hay r=-1], quan hệ hoàn toàn tuyến tính nghĩa là tất cả các


điểm nằm trên đường hồi quy [Hình 9.2 d và 9.2f]. Nếu trị tuyệt đối của r nhỏ hơn 1 sẽ có
các điểm số liệu phân tán chung quanh đường hồi quy.
- Bình phương của hệ số tương quan [r 2] thể hiện tỉ lệ biến thiên của biến số phụ thuộc
được giải thích bằng sự biến thiên của biến số độc lập [nếu mối liên hệ này là nhân quả]
- Nếu r=0, không có mối liên hệ tuyến tính giữa hai biến số. Ðiều này có nghĩa là [1]
không có mối liên hệ gì giữa hai biến số hoặc [2] mối liên hệ giữa hai biến số không phải
là tuyến tính.
- Theo quy ước, quan hệ với r từ 0,1 đến 0,3 là quan hệ yếu, từ 0,3 đến 0,5 quan hệ trung
bình và trên 0,5 là quan hệ mạnh. Ðiều quan trọng là sự tương quan giữa hai biến số cho
thấy sự liên hệ nhưng không nhất thiết có nghĩa là cá quan hệ 'nhân quả'.
Để kiểm định hệ số tương quan Pearson có thực sự khác 0 hay không, kiểm định t có thể
được sử dụng

t=r

n−2
1 − r 2 có phân phối student với n-2 độ tự do.

Hồi quy
Hồi quy là một mô hình toán học mô tả sự biến đổi của một biến số này theo những biến
số khác.
Một phương trình hồi quy có thể có dạng như sau:
cân nặng [kg] = 6,85 + 0,18 x tháng tuổi
[phương trình hồi quy tính cân nặng của trẻ từ 9 đến 40 tháng tuổi theo tháng tuổi]


theo phương trình này người ta gọi:
cân nặng: biến số phụ thuộc
tháng tuổi: biến số độc lập
6,85: hệ số của hằng số [Constant], hay còn gọi là điểm chặn [intercept]
0,18: hệ số [Coeficient] của biến số tháng tuổi hay còn gọi là độ dốc [Slope] của
đường hồi quy
9. Vẽ phân tán đồ [scattergram] giữa của biến số tuổi thai [tuoithai] và trọng lượng thai
[tlsosinh].
Hướng dẫn: sử dụng menu Graphics :: Overlaid twoway graph

để hiện ra cửa sổ twoway – Twoway graphs


Trên cửa sổ twoway – Twoway graphs, nhập tên biến số phụ thuộc vào hộp Y-axis
variable và tên biến số độc lập vào hộp X-axis variable sau đó nhấp OK để xem biểu đồ
phân tán. Cách làm cụ thể từng bước như sau:
Bước 1: Trên hộp combo Type chọn Scatter
Bước 2: Đặt tên biến số độc lập [tuoithai] vào ô văn bản X
Bước 3: Đặt tên biến số phụ thuộc [tlsosinh] vào ô văn bản Y
Bước 4: Nhấp nút lệnh OK

Có thể cho đồ thị phân tán. Tuy nhiên chúng ta có thể thêm các tùy chọn để thực hiện các
yêu cầu sau:
• Bổ sung tiêu đề “trọng lượng trẻ sơ sinh [gam]" cho trục tung
• Cho các giá trị trục y từ 500 đến 5000 gram và chia các khoảng 500 gram.
• Bổ sung tiêu đề “tuoi thai [tuan tuoi]" cho trục hoành





Cho các giá trị của trục x từ 24 tuần tuổi đến 42 tuần tuổi và chia làm các khoảng 4
tuần
Bằng cách trong cửa sổ Trên cửa sổ twoway – Twoway graphs thực hiện các bước:
Trên thẻ Plot 1:
Bước 1: Trên hộp combo Type chọn Scatter
Bước 2: Đặt tên biến số độc lập [tuoithai] vào ô văn bản X
Bước 3: Đặt tên biến số phụ thuộc [tlsosinh] vào ô văn bản Y
Trên thẻ Y-Axis:
Bước 4: Trên hộp văn bản Title gõ "Trong luong tre so sinh [gam]"
Bước 5: Trên hộp văn bản Rule gõ quy tắc "500[500]5000"
Bước 6: Trên hộp combo Angle chọn "Horizontal"
Trên thẻ X-Axis:
Bước 7: Trên hộp văn bản Title gõ "Tuoi thai [tuan]"
Bước 8: Trên hộp văn bản Rule gõ quy tắc "24[2]42"
Và nhấp vào nút lệnh OK.

Trả lời: Có sự tương quan thuận tuyến tính giữa trọng lượng sơ sinh và tuổi thai. Mối
tương quan này khá chặt do đám mây có tính chất đi lên [khi nó đi về phải] và có đường
kính bé nhỏ hơn nhiều so với đường kính lớn.
10. Hãy xác định hệ số tương quan giữa trọng lượng sơ sinh [tlsosinh], tuổi thai [tuoithai]
và tuổi của mẹ [tuoime]
Hướng dẫn: Sử dụng menu Statistics :: Summaries, tables, & tests :: Summary statistics ::
Pairwise correlations.


Khi đó hộp thoại pwcorr – Pairwise correlations of variables sẽ hiện ra.


Tiến hành các bước sau:
Bước 1: Nhấp con trỏ chuột vào hộp văn bản Variables


Bước 2: Đưa con trỏ chuột vào cửa sổ Variables và nhấp vào các biến tlsosinh, biến
tuoithai và biến tuoime để tên 3 biến này xuất hiện ở hộp văn bản Variables.
Bước 3: Đánh dấu vào hộp kiểm Print significance level for each entry
Bước 4: Đánh dấu vào hộp kiểm Significance level for displaying with a star.
Bước 5: Nhấp vào nút lệnh OK để xem kết quả.
. pwcorr tlsosinh tuoithai tuoime, sig star[5]
| tlsosinh tuoithai
tuoime
-------------+--------------------------tlsosinh |
1.0000
|
|
tuoithai |
0.7376* 1.0000
|
0.0000
|
tuoime |
0.0337
0.0151
1.0000
|
0.3941
0.7026

Trả lời: Chương trình cho kết quả hệ số tương quan của trọng lượng thai với trọng lượng
thai là 1, giữa trọng lượng thai và tuổi thai là 0.7376 [giá trị p=0,0000], giữa trọng lượng
thai và tuổi của mẹ là 0,0337 [giá trị p = 0,3941]. Như vậy có sự tương quan mạnh có ý
nghĩa thống kê giữa trọng lượng thai và tuổi thai trong khi đó sự tương quan giữa trọng
lượng thai và tuổi mẹ rất yếu và không có ý nghĩa thống kê. Do có sự liên hệ có ý nghĩa


thống kê [giá trị p F

=

R-squared

=

Adj R-squared =
Root MSE

=

tlsosinh |
Coef.
Std. Err.
t
P>|t|
[95% Conf.


Interval]
--------+-------------------------------------------------------------------tuoithai |
206.6412
7.484572
27.609
0.000
191.9439
221.3386
_cons | -4865.245
290.0814
-16.772
0.000
-5434.873
-4295.617

Trả lời: Hệ số tương quan bình phương R-squared = 0.544 = 54.4% nói lên tuổi thai có
thể giải thích cho 54.4% sự thay đổi về trọng lượng sơ sinh. Bảng ANOVA cho biết có
tổng các sai lệch của bình phương trọng lượng sơ sinh 272.720.122 [272.7 triệu] mà
phương trình hồi quy có thể giải thích cho 148.3 triệu của sự sai lệch này [như vậy còn
124.4 triệu tổng bình phương sai lệch chưa được giải thích gọi là Residual Sum of


Square và giá trị 0.45 chính là giá trị 148.3/272.7]. Mức ý nghĩa được trình bày trong
bảng ANOVA cho biết mức ý nghĩa của phương trình.
Dựa vào bảng các hệ số chúng ta có thể xây dựng phương trình hồi quy như sau:
Trọng lượng sơ sinh = -4865.245 + 206.641 x tuổi thai [tính theo tuần].
Mức ý nghĩa [P-value] của biến số tuổi thai [Gestational age] là kết quả của kiểm định ý
nghĩa của biến số này trong phương trình có thực sự khác không hay không.
Hệ số [coefficient] của biến số độc lập nói lên sự thay đổi của biến số phụ thuộc khi
biến số độc lập thay đổi một đơn vị. Trong phương trình này [với biến số độc lập là


TUOITHAI và biến số phụ thuộc là TLSOSINH] chúng ta có thể lí giải nếu đứa trẻ lớn
hơn 1 tuần tuổi trọng lượng lúc sanh của nó sẽ tăng thêm 206.641 gram.
12. Hãy xây dựng phương trình hồi quy của trọng lượng thai theo tuổi thai, giới tính của
trẻ và huyết áp cao của mẹ.
Hướng dẫn: Sử dụng phương pháp hồi quy đơn bằng cách nhấp vào menu "Statistics ::
Linear regression and related :: Linear regression" để hiện ra hộp thoại regress – Linear
regression

Nhập tên biến số phụ thuộc [tlsosinh] vào hộp Dpendent variable và tên các biến số độc
lập [tuoithai gioi tang_ha] vào hộp Idependent variables, rồi nhấn OK để tiếp tục. Khi đó
hộp thoại chẩn đoán sẽ hiện ra. Tuy nhiên nếu chúng ta không quan tâm đến việc chẩn
đoán các vấn đề trong phương trình hồi quy chúng ta hãy nhấp vào nút Cancel.
. regress tlsosinh tuoithai gioi tang_ha
Source |
SS
df
MS
641
-------------+-----------------------------275.43

Number of obs =
F[

3,

637] =


Model |
153998584


3 51332861.4
0.0000
Residual |
118721538
637
186376.04
0.5647
-------------+-----------------------------0.5626
Total |
272720122
640
426125.19
431.71

Prob > F

=

R-squared

=

Adj R-squared =
Root MSE

=

----------------------------------------------------------------------------tlsosinh |
Coef.
Std. Err.


t
P>|t|
[95% Conf.
Interval]
------------+---------------------------------------------------------------tuoithai |
201.4248
7.541441
26.71
0.000
186.6157
216.2339
gioi |
167.8167
34.17884
4.91
0.000
100.6999
234.9335
tang_ha |
-142.14
50.8685
-2.79
0.005
-242.0302
-42.24979
_cons | -4729.048
294.1447
-16.08
0.000
-5306.659


-4151.438
-----------------------------------------------------------------------------

Trả lời: Chúng ta tìm được r2 [R-squared] là 0.5647 cho thấy phương trình hồi quy giải
thích được 56.47% sự biến thiên của trọng lượng thai và điều này cho thấy mô hình có cả
giới tính và tăng huyết áp giải thích tốt hơn so với mô hình chỉ có tuổi thai [r2=0.54].
Chúng ta cũng có thể viết được phương trình hồi quy theo kết quả ở trên:
Trọng lượng thai = -4729.048 + tuổi thai x 201.425 - tăng huyết áp x 142.14 + giới x
167.817
10. Bạn có gợi ý gì để trình bày phương trình hồi quy một cách dễ hiểu hơn đối với người
không chuyên về thống kê.
Hướng dẫn: Bởi vì người không chuyên về thống kê hay người chưa được làm quen với
phương pháp mã hoá sẽ không biết làm sao để nhân tăng huyết áp với 142.14 hay giới
với 167,817. Chúng ta nhớ lại quy ước của tập tin này:
Biến tăng huyết áp [tang_ha] có giá trị =0 nếu mẹ không bị tăng huyết áp
Biến giới tính [gioi] có giá trị =0 nếu trẻ là trẻ gái
a] Do đó phương trình hồi quy đối với trẻ gái có mẹ không tăng huyết áp là:
Trọng lượng thai = -4729.048 + tuổi thai x 201.425
[a]
b] Ở trẻ trai với mẹ không tăng huyết áp, trọng biến số phụ thuộc của phương trình hồi
quy sẽ tăng lên 167,817 gram nên phương trình hồi quy sẽ là
Trọng lượng thai = -4561.23 + tuổi thai x 201.425
[b]
c] Ở trẻ gái với mẹ bị tăng huyết áp, trọng biến số phụ thuộc của phương trình hồi quy sẽ
sẽ giảm đi 142,14 gram so với phương trình [a] nên phương trình hồi quy cho nhóm này

Trọng lượng thai = -4871.19 + tuổi thai x 201.425
d] Ở trẻ trai với mẹ bị tăng huyết áp, trọng biến số phụ thuộc của phương trình hồi quy sẽ
sẽ giảm đi 142,14 gram so với phương trình [b] nên phương trình hồi quy cho nhóm này




Video liên quan

Chủ Đề