Hạng nhiễu trong mô hình hồi quy là gì năm 2024

Biến phụ thuộc trong hầu hết các mô hình hồi quy đều bằng số, thường được đo theo một thang đo tỷ lệ (ratio scale). Nhưng trong nhiều ứng dụng thì các biến phụ thuộc là định danh (nominal) theo nghĩa rằng chúng biểu hiện các phân loại (categories), như nam hoặc nữ, có gia đình hoặc chưa có gia đình, có việc làm hoặc thất nghiệp, trong lực lượng lao động hoặc không thuộc lực lượng lao động. Giả sử chúng ta có dữ liệu về những người trưởng thành, một số trong họ hút thuốc và một số khác thì không. Hơn nữa, giả sử rằng chúng ta muốn biết các nhân tố nào quyết định việc một người hút thuốc hay không. Vì thế biến tình trạng hút thuốc là một biến định danh; hoặc là bạn hút thuốc hoặc là bạn không hút thuốc. Chúng ta mô hình hóa các biến định danh như thế như thế nào? Chúng ta có thể sử dụng các kỹ thuật hồi quy cổ điển hay chúng ta cần các kỹ thuật chuyên biệt? Các mô hình hồi quy liên quan đến các biến có thang đo định danh là một ví dụ của một lớp các mô hình được gọi chung là các mô hình hồi quy phản ứng định tính (qualitative response regression models). Có rất nhiều loại mô hình như thế, nhưng trong chương này chúng ta sẽ xem xét một loại đơn giản nhất trong các mô hình đó, có tên gọi là các mô hình hồi quy có biến phụ thuộc là biến giả

(Gujarati: Econometrics by example, 2011) 1. Người dịch và diễn giải: Phùng Thanh Bình vnp.edu/

C

Một trong những vấn đề thường gặp trong dữ liệu chéo là phương sai thay đổi (phương sai không bằng nhau) trong thành phần hạng nhiễu. Có nhiều lý do của phương sai thay đổi, như hiện diện của các quan sát bất thường trong dữ liệu (outliers), sai dạng hàm của mô hình hồi quy, hoặc chuyển đổi dữ liệu không đúng, hoặc hỗn hợp các quan sát với các thước đo quy mô khác nhau (như hỗn hợp các gia đình thu nhập cao với các gia đình thu nhập thấp), vân vân.

5. 1 Hậu quả của phương sai thay đổi 2

Mô hình hồi quy tuyến tính cổ điển giả định rằng hạng nhiễu ui trong mô hình hồi quy có phương sai không đổi (phương sai bằng nhau) qua các quan sát, được ký hiệu là  2. Ví dụ, khi nghiên cứu chi tiêu cho tiêu dùng trong mối quan hệ với thu nhập, giả định này hàm ý rằng các hộ gia đình thu nhập thấp và thu nhập cao có cùng phương sai của hạng nhiễu mặc dù mức chi tiêu cho tiêu dùng trung bình là khác nhau.

Tuy nhiên, nếu giả định phương sai không đổi, hoặc phương sai bằng nhau, không thỏa mãn, thì chúng ta gặp vấn đề phương sai không đồng nhất, được ký hiệu là i2 (lưu ý chỉ số dưới i). Vì thế, so sánh với các hộ gia đình thu nhập thấp, thì các hộ gia đình thu nhập cao không chỉ có mức chi tiêu cho tiêu dùng trung bình cao hơn, mà mà khả năng biến thiên lớn hơn trong chi tiêu cho tiêu dùng của họ. Kết quả là, trong mô hình hồi quy chi tiêu cho tiêu dùng theo thu nhập gia đình chúng ta có thể gặp phải vấn đề phương sai thay đổi.

Phương sai thay đổi có các hậu quả sau đây:

  1. Phương sai thay đổi không làm thay đổi các tính chất không chệch (unbiasedness) và nhất quán (consistency) của các ước lượng OLS.
  2. Nhưng các ước lượng OLS không còn hiệu quả, hoặc không có phương sai bé nhất nữa. Nghĩa là, chúng không còn là các ước lượng tuyến tính không chệch tốt nhất (BLUE); chúng chỉ đơn giản là các ước lượng tuyến tính không chệch (LUE).

1 Hiện nay đã có ấn bản mới (lần 2, năm 2015). Dữ liệu của phiên bản 2011: macmillanihe/companion/Gujarati-Econometrics-By-Example/student-zone/ 2 Để biết chi tiết, xem Gujarati/Porter, Chương 11.

  1. Kết quả là, các kiểm định t và F dựa trên các giả định chuẩn của mô hình hồi quy tuyến tính cổ điển không thể tin cậy, dẫn đến các kết luận sai lầm về ý nghĩa thống kê của các hệ số hồi quy được ước lượng.
  2. Khi có hiện tượng phương sai thay đổi, các ước lượng BLUE được cung cấp bởi phương pháp bình phương bé nhất có trọng số (WLS, weighted least squares).

Bởi vì những hậu quả này, nên điều quan trọng là chúng ta phải kiểm tra phương sai thay đổi, thường gặp ở dữ liệu chéo. Trước khi làm điều này, chúng ta hãy xem xét một ví dụ cụ thể.

5. 2 Tỷ lệ phá thai ở Mỹ

Đâu là các yếu tố quyết định tỷ lệ phá thai giữa 50 bang ở Mỹ? Để nghiên cứu vấn đề này, chúng ta thu thập dữ liệu như trong Table 5 .1, bạn có thể tìm thấy tập dữ liệu này trên trang web của cuốn sách 3.

Các biến được sử dụng trong phần tích này như sau:

State = tên của bang (50 bang của Mỹ) ABR = tỷ lệ phá thai, số ca phá thai trên 1000 phụ nữ tuổi từ 15 đến 44 năm 1992. Religion = phần tram dân số của bang theo đạo Cơ đốc giáo, đạo Báp tít miền nam, đạo Tin lành, hoặc đạo Mặc môn. Price = giá trung bình năm 1993 cho các thiết bị y tế ngoài bệnh viện tính cho một ca phá thai giai đoạn 10 tuần có gây mê tại chổ (tính trọng số bởi số ca phá thai thực hiện năm 1992). Laws = một biến nhận giá trị bằng 1 nếu bang ban hành luật hạn chế phá thai, bằng 0 nếu không có luật này. Funds = một biến nhận giá trị bằng 1 nếu quỹ của bang sẵn có cho việc sử dụng thanh toán một làn phá thai cho hầu hết các trường hợp, bằng 0 nếu không có sẵn quỹ. Educ = phần trăm dân số của bang mà dân số từ 25 tuổi trở lên có bằng phổ thông trung học hoặc tương đương, 1990. Income = thu nhập khả dụng bình quân đầu người, 1992. Picket = phần trăm người trả lời khai báo có tham gia biểu tình ngăn chặn bệnh nhân.

Mô hình

Như một điểm khởi đời, chúng tá xem xét mô hình hồi quy tuyến tính sau đây:

Chúng ta kỳ vọng ABR có mối quan hệ âm với tôn religion, price, laws, picket, educ, và có mối quan hệ dương với fund và income. Chúng ta giả định hạng nhiễu thỏa mãn các giả định cổ điển chuẩn, bao gồm giả định phương sai không đổi. Dĩ nhiên, chúng ta sẽ

3 Dữ liệu được thu thập từ trang web của Leo H. Kahane, cbe.csueastbay/~kahane.

Rõ ràng từ hình này chúng ta thấy rằng, phần dư bình phương – một đại diện của hạng nhiễu bình phương, không cho thấy rằng hạng nhiễu có phương sai không đổi 4.

Chúng ta có cái nhìn rõ hơn về phương sai thay đổi nếu chúng ta vẽ đồ thị phần dư bình phương (S1S) theo tỷ lệ phá thai ước lượng từ mô hình hồi quy, tức ABR̂ (Hình 5).

Hình 5 .1: Đồ thị tần suất của phần dư bình phương.

Hình 5: Phần dư bình phương theo tỷ lệ phá thai ước lượng.

[Diễn giải: Trên Eviews, sau khi vừa hồi quy Bảng 5, chúng ta tạo biến S1S = resid^2 và ABR_hat = ABR – resid. Với Stata, sau khi hồi quy Bảng 5, chúng ta sử dụng lệnh predict S1S, resid; và predict ABR_hat].

5. 3 Phát hiện phương sai thay đổi

Bên cạnh các phương pháp đồ thị được mô tả ở phần trước, chúng ta có thể sử dụng hai kiểm định phương sai thay đổi được sử dụng phổ biến, đó là kiểm định Breusch- Pagan và kiểm định White 5.

4 Nhớ lại rằng ước lượng OLS của phương sai hạng nhiễu được cho bằng: 𝜎̂ 2 = ∑ 𝑒𝑖 2 /(𝑛 − 𝑘), nghĩa là tổng bình phương phần dư chia cho bậc tự do. 5 Chi tiết về hai kiểm định này và những kiểm định khác có thể thấy trong Gujarati/Porter, Chương 11.

Kiểm định Breusch-Pagan (BP)

Kiểm định này bao gồm các bước sau đây:

  1. Ước lượng hồi quy OLS, như ở Bảng 5, và lưu phần dư OLS, tạo biến phần dư bình phương, ei2, thừ hồi quy này.
  2. Hồi quy ei2 theo k biến giải thích trong mô hình; ý tưởng ở đây là xem phần dư bình phương (như một đại diện của hạng nhiễu bình phương) có liên quan với một hoặc nhiều biến X 6. Bạn cũng có thể chọn các biến giải thích khác mà bạn cho là có liên quan đến phương sai hạng nhiễu. Bây giờ chạy phương trình hồi quy sau đây:

Trong đó vi là hạng nhiễu. Lưu R 2 từ hồi quy (5); gọi là R2aux (tức R 2 của hồi quy phụ), vì phương trình (5) là hồi quy phụ của phương trình hồi quy chính (5) (xem Bảng 5). Ý tưởng đằng sau phương trình (5) là tìm hiểu xem liệu phần dư bình phương có quan hệ gì với một hoặc nhiều biến giải thích, nếu có thì đó là dấu hiệu cho chúng ta biết có lẽ có phương sai thay đổi hiện diện trong dữ liệu.

Bảng 5. 3 : Kiểm định BP về phương sai thay đổi.

6 Mặc dù ei2 không giống ui2, nhưng trong các mẫu lớn thì phần dư bình phương là một đại diện tốt cho phương sai hạng nhiễu.

Lưu ý: Stata thay các biến giải thích bằng Ŷ 𝑖, nên giá trị kiểm định có khác so với kết quả từ Eviews.

Kiểm định White

Chúng ta tiếp tục tinh thần của kiểm định BP và hồi quy phần dư bình phương theo 7 biến giải thích, bình phương của các biến giải thích, và tích từng cặp giữa các biến giải thích này. Như vậy, chúng ta có tổng cộng 33 hệ số.

Như trong kiểm định BP, chúng ta thu giá trị R 2 từ hồi quy (phụ) này và nhân R 2 với số quan sát. Dưới giả thuyết H 0 là phương sai không đổi, thì tích (nR 2 ) theo phân phối Chi bình phương với số bậc tự do bằng với số hệ số ước lượng. Kiểm định White tổng quát hơn và linh hoạt hơn so với kiểm định BP.

Trong ví dụ hiện tại của chúng ta, nếu chúng ta không đưa các số hạng bình phương và tích chéo theo cặp vào hồi quy phụ, thì chúng ta có nR 2 = 15, giá trị này theo phân phối Chi bình phương với 7 bậc tự do. Xác suất để có một giá trị Chi bình phương bằng hoặc lớn hơn giá trị như thế khoảng 0, giá trị xác suất này khá thấp. Điều này cho thấy rằng chúng ta có thể bác bỏ giả thuyết H 0 về phương sai không đổi.

Nếu chúng ta đưa thêm các số hạng bình phương và tích chéo theo cặp vào hồi quy phụ, thì chúng ta có nR 2 = 32, có giá trị Chi bình phương với 33 bậc tự do 10. Xác suất để có một giá trị Chi bình phương như thế khoảng 0. Trong trường hợp này, chúng ta sẽ không bác bỏ giả thuyết H 0.

Như bài tập này cho thấy, kiểm định Chi bình phương theo White rất nhạy cảm đối với việc chúng ta đưa hay bỏ các số hạng bình phương và tích chéo vào/ra hồi quy phụ 11. Nhớ rằng kiểm định White là một kiểm định mẫu lớn. Vì thế, khi chúng ta đưa các biến giải thích và các số hạng bình phương và tích chéo vào mô hình, dẫn đến mất đi 33 bậc tự do. Nên kết quả của hồi quy phụ có thể rất nhạy cảm, như trường hợp hiện tại của chúng ta.

Để tránh mất quá nhiều bậc tự do, kiểm định White có thể được rút ngắn bằng cách hồi quy phần dư bình phương theo giá trị ước lượng của biến phụ thuộc và bình phương của nó 12. Nghĩa là, chúng ta hồi quy phương trình sau đây:

Trong đó Abortionf = giá trị dự báo của tỷ lệ phá thai từ phương trình (5). Vì tỷ lệ phá thai ước lượng là một hàm tuyến tính của các biến giải thích trong mô hình của phương trình (5), theo một cách mà chúng ta đang gián tiếp đưa các biến giải thích và các bình phương của chúng để ước lượng phương trình (5), điều này vẫn trong tinh thần của kiểm định White ban đầu. Nhưng lưu ý rằng trong phương trình (5) không có chổ cho

10 Bởi vì chúng ta có 7 biến giải thích, 5 biến giải thích bình phương (tức trừ 2 biến giả) và tích chéo của mỗi biến giải thích với các biến giải thích khác. Nhưng lưu ý rằng chúng ta không đưa giá trị bình phương của các biến giả, vì bình phương của một biến giả có giá trị bằng 1 cũng là 1. Cũng lưu ý rằng tích chéo của biến religion với income cũng giống như giống với tích chéo của income với religion, để tránh tính trùng (double-counting). 11 Đó là lý do tại sao phải lưu ý rằng kiểm định White sức mạnh thống kê (statistical power) yếu. Sức mạnh thống kê của một kiểm định là xác suất bác bỏ giả thuyết H 0 khi giả thuyết đó sai. 12 Xem Jeffrey M. Wooldridge, Introductory Econometrics: A Modern Approach, 4th edn, South-Western Publishing, 2009, p. 275.

5. 4 Biện pháp khắc phục

Sau khi biết các hậu quả của phương sai thay đổi, có lẽ chúng ta cần tìm các biện pháp khắc phục. Vấn đề ở đây là chúng ta không biết các phương sai thực khác nhau, tức các i2, vì hiếm khi chúng được quan sát. Nếu chúng ta có thể quan sát chúng, thì chúng ta có thể có được các ước lượng BLUE bằng cách chia mỗi quan sát cho i (thay đổi) và ước lượng mô hình được chuyển hóa theo OLS. Phương pháp ước lượng này được biết với tên gọi là bình phương bé nhất có trọng số (WLS) 14. Thật không may, các phương sai thực i2 hiếm khi được biết. Như vậy giải pháp là gì?

Trong thực tế, chúng ta thực hiện các phán đoán về các i2 có thể có là gì và chuyển đổi mô hình hồi quy gốc theo một cách sao cho trong mô hình được chuyển hóa phương sai của hạng nhiễu có thể là đồng nhất. Vài cách chuyển hóa được sử dụng trong thực tế như sau 15 :

  1. Nếu phương sai thực tỷ lệ với bình phương của một trong số các biến giải thích, chúng ta có thể chia cả hai vế của phương trình (5) cho biến đó và chạy hồi quy đã được chuyển hóa. Giả sử trong phương trình (5), phương sai của hạng nhiễu tỷ lệ với bình phương của biến income. Vì thế chúng ta chia cả hai vế của phương trình (5) cho biến income và ước lượng phương trình chuyển hóa này. Sau đó chúng ta kiểm định phương sai thay đổi cho phương trình này bằng các kiểm định như BP và White. Nếu các kiểm định này chỉ ra rằng không có dấu hiệu của phương sai thay đổi, thì chúng ta giả định rằng hạng nhiễu được chuyển hóa có phương sai không đổi.
  2. Nếu phương sai thực tỷ lệ với một trong số các biến giải thích, chúng ta có thể cách chuyển hóa bình phương (square transformation), nghĩa là, chia cả hai vế của phương trình (5) cho căn bậc hai của biến giải thích được chọn. Sau đó

14 Vì mỗi quan sát chia cho (tức gán trọng số) i, nên một quan sát với i lớn sẽ bị giảm nhiều hơn so với một quan sát với i thấp. 15 Để biết chi tiết, xem Gujarati/Porter, pp. 392 – 5.

chúng ta ước lượng hồi quy đã được chuyển hóam và kiểm định phương sai thay đổi cho phương trình này bằng các kiểm định như BP và White. Nếu các kiểm định này thỏa mãn, thì chúng ta có thể sử dụng kết quả hồi quy này. Có các vấn đề thực tế trong các ứng dụng các thủ tục này. Thứ nhất, làm sao chúng ta biết chọn biến giải thích nào để chuyển hóa nếu có nhiều biến giải thích? Chúng ta có thể tiến hành bằng cách thử - sai, nhưng cách đó có thể sẽ mất thời gian. Thứ hai, nếu vài giá trị của biến giải thích được chọn bằng 0, thì việc chia cho 0 hiễn nhiên sẽ là có vấn đề. Sự lựa chọn nhầm biến giải thích đôi khi có thể tránh được bằng cách sử dụng giá trị Y ước lượng (tức là Ŷ ), đó là một giá trị trung bình có trọng số của tất cả các biến giải thích trong mô hình, và trọng số chính là các hệ số hồi quy, tức là các bs. Cũng cần lưu ý rằng tất cả các phương pháp chuyển hóa này hơi mang tính tình thế. Nhưng chúng ta không có nhiều sự lựa chọn, vì chúng ta đang cố gắng dự đoán phương sai thực của hạng nhiễu là gì. Tất cả những gì mà chúng ta có thể hy vọng là mong sao dự đoán của chúng ta đúng một cách hợp lý. Để minh họa tất cả những cách chuyển hóa này có thể sẽ tốn nhiều thời gian và không gian. Tuy nhiên, chúng ta sẽ chỉ minh họa một trong những cách chuyển hóa này. Nếu chúng ta chia phương trình (5) cho tỷ lệ phá thai ước lượng từ phương trình (5), chúng ta có kết quả như được trình bày trong Bảng 5.

Bảng 5. 5 : Phương trình (5) sau khi chuyển hóa.

Chúng ta thực hiện các kiểm định BP và White cho phương trình này, nhưng cả hai kiểm định đều cho thấy vấn đề phương sai thay đổi vẫn còn tồn tại 16.

16 Để tiết kiệm không gian, chúng ta không trình bày chi tiết các kết quả kiểm định. Bạn đọc có thể xác nhận kết luận này bằng cách chạy các kiểm định với dữ liệu được cho trong Table 5.

khác được giữ nguyên không đổi). Tất cả các hệ số khác cũng được giải thích một cách tương tự 18. Bảng 5. 6 : Hồi quy dạng logarít tỷ lệ phá thai.

Khi thực hiện các kiểm định BP và White (không có các số hạng bình phương và tích chéo) của hồi quy này, chúng ta nhận thấy rằng hồi quy này không gặp phải phương sai thay đổi. Một lần nữa, kết quả hồi quy này nên được chấp nhận một cách thận trọng, vì mẫu 50 quan sát của chúng ta có thể là không đủ lớn. Kết luận này nên lên một điểm quan trọng về các kiểm định phương sai thay đổi. Nếu một hoặc hơn một trong số các kiểm định này chỉ ra rằng chúng ta có vấn đề phương sai thay đổi, thì có thể đó không phải là phương sai thay đổi do bản chất của vấn đề mà là do một lỗi sai dạng mô hình, một chủ đề chúng ta sẽ thảo luận ở chương 7.

Sai sai số chuẩn điều chỉnh phương sai thay đổi hoặc sai số chuẩn mạnh của

White 19

[Diễn giải: Công thức điều chỉnh như sau (xem Wooldridge, 5th edn, p. 271):]

  • Bước 1: Hồi quy phương trình sau đây: Yi = b 1 + b 2 X 2 + b 3 X 3 + ... + bkXk + ei (*) Lưu phần dư ei, tạo biến ei2.
  • Hồi quy Xj theo các biến giải thích còn lại trong mô hình (), Xj lần lượt là X 2 , X 3 , ..., Xk. Ví dụ: Xj là X 2 : Xj = a 1 + a 3 X 3 + a 4 X 4 + .... + akXk + vij (.*)

18 Nhưng nhớ lại rằng cảnh báo được đề cập ở chương trước về cách giải thích các biến giả trong các hồi quy dạng mô hình bán log. 19 Để biết chi tiết, xem Gujarati/Porter, p. 391.

Lưu phần dư vij, tạo biến vij2. Lưu RSS từ phương trình (.), đặt tên là RSSj., và tạo RSSj2.

  • Công thức tính phương sai điều chỉnh phương sai thay đổi của White cho hệ số bj (tức b 2 ) như sau:

σ̂ b 2 j =

∑ ni=1 v𝑖𝑗 2 .e𝑖 2 RSS𝑗 2

(..*)

Nếu cỡ mẫu lớn, White đã đề xuất một thủ tục để có được các sai số chuẩn điều chỉnh phương sai thay đổi (heteroscedasticity-corrected standard errors). [Xem công thức (..*) ở trên]. Trong lý thuyết, các sai số chuẩn điều chỉnh này được biết với tên gọi là các sai số chuẩn mạnh (robust standard errors). Quy trình của White bây giờ đã được lập trình sẵn trong nhiều phần mềm kinh tế lượng. Thủ tục này không làm thay đổi các giá trị của các hệ số hồi quy như được cho trong Bảng 5, nhưng điều chỉnh các sai số chuẩn để cho phép phương sai thay đổi. Sử dụng Eviews, chúng ta có các kết quả như được trình bày trong Bảng 5.

Bảng 5 .7: Các sai số chuẩn mạnh của hồi quy tỷ lệ phá thai.

Nếu bạn so sánh các kết quả này với các kết quả trong Bảng 5, bạn sẽ thấy một vài thay đổi. Biến price bây giờ ít ý nghĩa hơn trước, mặc dù các hệ số của income và picket vẫn có cùng mức ý nghĩa. Nhưng lưu ý rằng các hệ số hồi quy ước lượng vẫn giống nhau giữa hai bảng kết quả.

Nhưng đừng quên rằng thủ tục White chỉ có hiệu lực trong các mẫu lớn, nên có thể không đúng trong trường hợp ví dụ hiện tại của chúng ta. Chúng ta hãy xem xét lại trước hết là hàm tiền lương trong Chương 1 và sau đó là hàm số giờ làm việc đã được thảo luận trong Chương 4; cả hai trường hợp mẫu của chúng ta tương đối lớn.

Kiểm định BP: Khi các phần dư bình phương thu được từ mô hình trong Bảng 1 được hồi quy theo các biến giải thích trong hồi quy hàm tiền lương, chúng ta có giá trị R 2 là 0. Nhân giá trị này với số quan sát, 1, chúng ta có một giá trị Chi bình phương khoảng 55. Với 5 bậc tự do, tức số biến giải thích trong hàm tiền lương, thì xác suất để có một giá trị bằng hoặc lớn hơn giá trị Chi bình phương đó thực tế là bằng 0, điều này cho thấy rằng hàm tiền lương trong Bảng 1 thực sự bị vấn đề phương sai thay đổi.

Kiểm định White: Để biết liệu rằng các kết quả kiểm định BP có tin cậy không, chúng ta sử dụng kiểm định White, cả loại trừ và đưa vào các số hạng bình phương và tích chéo. Các kết quả như sau. Khi loại bỏ các số hạng bình phương và tích chéo, nR 2 = 62, theo phân phối Chi bình phương với 5 bậc tự do. Xác suất để có được một giá trị bằng hoặc lớn hơn giá trị Chi bình phương như thế thực tế bằng 0. Điều này khẳng định rằng hồi quy hàm tiền lương thực sự bị phương sai thay đổi.

Bảng 5. 8 : Hàm tiền lương điều phương sai thay đổi.

Khi chúng ta đưa các số hạng bình phương và tích chéo của các biến giải thích vào phương trình kiểm định, chúng ta có nR 2 = 79, có phân phối Chi bình phương với 17 bậc tự do (5 biến giải thích, 2 biến bình phương, và 10 số hạng tích chéo của các biến giải thích). Xác suất để có một giá trị bằng hoặc lớn hơn giá trị Chi bình phương như thế thực tế bằng 0.

Tóm lại, chúng ta có bằng chứng mạnh để kết luận rằng hồi quy hàm tiền lương trong Bảng 1 gặp phải vấn đề phương sai thay đổi.

Thay vì chuyển hóa hàm tiền lương trong Bảng 1 bằng cách chia hai vế cho một hoặc hơn một biến giải thích, chúng ta có thể đơn giản điều chỉnh vấn đề phương sai thay đổi bằng cách tính các sai số chuẩn mạnh theo thủ tục của White. Các kết quả này được trình bày trong Bảng 5.

Nếu bạn so sánh các kết quả này với các kết quả trong Bảng 1, thì bạn sẽ thấy các hệ số hồi quy giống nhau, nhưng một số các sai số chuẩn đã thay đổi, và điều này làm thay đổi các giá trị t.

Xem xét lại hàm số giờ làm việc

Xem xét các kết quả được cho trong Bảng 4 về số giờ làm việc bởi 753 phụ nữ có gia đình. Các kết quả này không được điều chỉnh phương sai thay đổi. Trên cơ sở các kiểm định BP và White (có hoặc không có các số hạng bình phương và tích chéo), chúng ta

Bảng 4: Hồi quy số giờ làm việc của phụ nữ

5. 5 Tóm tắt và kết luận

Trong chương này chúng ta đã xem xét một trong số các vi phạm về giả định của mô hình hồi quy tuyến tính cổ điển, đó là phương sai thay đổi, thường gặp trong dữ liệu chéo. Mặc dù phương sai thay đổi không phá hủy các tính chất không chệch và nhất quán của các ước lượng OLS, nhưng các ước lượng OLS kém hiệu quả hơn, làm cho việc suy diễn thống kê trở nên kém tin cậy nếu chúng ta không điều chỉnh các sai số chuẩn của OLS thông thường.

Trước khi chúng ta giải quyết vấn đề phương sai thay đổi, chúng ta cần tìm hiểu xem liệu rằng chúng ta có khó khăn gì trong bất kỳ ứng dụng cụ thể nào hay không. Đối với mục đích này, chúng ta có thể phân tích phần dư bình phương từ mô hình gốc hoặc sử dụng vài kiểm định chính thức về phương sai thay đổi, chẳng hạn kiểm định Breusch- Pagan và kiểm định White. Nếu một hoặc hơn một trong số các kiểm định này cho thấy có tồn tại phương sai thay đổi, thì chúng ta có thể tiến hành sửa chửa vấn đề này.

Vấn đề phương sai thay đổi có thể được giải quyết nếu chúng ta biết các phương sai thay đổi, tức các i2, vì trong trường hợp đó chúng ta có thể chuyển hóa mô hình gốc (5) bằng cách chia cả hai vế cho I và ước lượng mô hình đã được chuyển hóa bằng OLS, khi đó chúng ta sẽ có các ước lượng BLUE. Phương pháp ước lượng này được biết với tên gọi là bình phương bé nhất có trọng số (WLS). Thật không may, chúng ta hiếm khi biết các phương sai thực của hạng nhiễu. Vì thế chúng ta cần giải pháp tốt thứ nhì.

Sử dụng các dự toán về bản chất có thể có của i2 chúng ta chuyển hóa mô hình gốc, ước lượng mô hình đó, rồi thực hiện các kiểm định phương sai thay đổi cho mô hình được chuyển hóa. Nếu các kiểm định này cho thấy rằng không có vấn đề phương sai thay đổi trong mô hình được chuyển hóa, thì chúng ta không thể bác bỏ mô hình được chuyển hóa. Tuy nhiên, nếu mô hình được chuyển hóa cho thấy rằng vấn đề phương sai thay đổi vẫn còn tồn tại, thì chúng ta có thể tìm một cách chuyển hóa khác và lặp lại chu trình một lần nữa.

Tuy nhiên, có thể đỡ mất công sức nếu chúng ta có một mẫu đủ lớn, bởi vì trong trường hợp đó chúng ta có thể sử dụng các sai số chuẩn điều chỉnh phương sai thay đổi theo thủ tục của White. Các sai số chuẩn điều chỉnh này được biết với tên gọi là các sai số chuẩn mạnh. Ngày nay, nhiều bột dữ liệu vi mô do nhiều cơ quan thực hiện có số lượng quan sát lớn, điều này giúp cho việc sử dụng các sai số chuẩn mạnh trong các mô hình hồi quy nếu có hoài nghi vấn đề phương sai thay đổi./.