Tự tương quan tiếng anh là gì

Nhóm Hỗ Trợ Stata giới thiệu về khái niệm tự tương quan, cùng với các kiểm định để xác định xem dữ liệu có bị tự tương quan hay không. Kiểm định này có sự khác biệt khi áp dụng đối với dữ liệu bảng và dữ liệu theo chuỗi thời gian, mỗi loại sẽ có cách kiểm định riêng. Phần này sẽ nói phần thực hành kiểm định tự tương quan trước, sau đó là phần lý thuyết.

Bạn đang xem: Tự tương quan là gì

Thực hành kiểm định tự tương quan

Kiểm định tự tương quan với dữ liệu chuỗi thời gian

Dùng kiểm định Durbin-Watson, kiểm định Breusch-Godfrey

Cách 1: Gõ lệnh dwstat ngay sau khi chạy hồi quy để tính toán giá trị Durbin-Watson, từ đó mới kết luận có tự tương quan hay không

. dwstat

Durbin-Watson d-statistic[ 7, 174] = 2.079461

Cách 2: Có cách khác để kiểm tra tự tương quan Durbin, đó là dùng lệnh durbinalt [kiểm định thay thế Durbin's alternative test for serial correlation] để tính toán trực tiếp ra mức ý nghĩa thống kê của kiểm định Durbin-Watson luôn.

Cú pháp lệnh là: estat durbinalt

Với giả thiết H0: không có tự tương quan, do đó với giá trị Prob>chi2 >5% như trên, ta kết luận chấp nhận giả thiết H0, có nghĩa là không có hiện tượng tự tương quan[ đây là điều mong đợi khi làm bài]

Cách 3: Hoặc cách khác nữa, dùng lệnh bgodfrey để kiểm định tự tương quan bằng kiểm định Breusch-Godfrey

Với giả thiết H0: không có tự tương quan, do đó với giá trị Prob>chi2 >5% của kiểm định Breusch-Godfrey như trên, ta kết luận chấp nhận giả thiết H0, có nghĩa là không có hiện tượng tự tương quan[ đây là điều mong đợi khi làm bài]

Trên đây là tự tương quan bậc 1, nếu muốn bậc 2, hoặc cao hơn thì thêm tham số lags vào, ví dụ lệnh sau kiểm tra tự tương quan bậc 2: estat bgodfrey,lags[2]

Kiểm định tự tương quan với dữ liệu bảng

Dùng kiểm định Wooldridge, với cú pháp như sau: xtserial y x1, x2…. [ y là biến phụ thuộc, x1,x2… là biến độc lập]

Với giả thiết Ho: Không có tương quan chuỗi[no first-order autocorrelation]

Do đó với giá trị Prob>F >5% của kiểm định Wooldridge như trên, ta kết luận chấp nhận giả thiết H0, có nghĩa là không có hiện tượng tự tương quan[ đây là điều mong đợi khi làm bài]

Lý thuyết

Bản chất của tự tương quan là gì ?

Thuật ngữ tự tương quan có thể được định nghĩa như là: quan hệ tương quan giữa các thành viên của chuỗi của các quan sát được sắp xếp theo thời gian [như trong dữ liệu chuỗi thời gian] hoặc không gian [như trong dữ liệu chéo]. Trong ngữ cảnh hồi qui, mô hình hồi qui tuyến tính cổ điển giả định rằng quan hệ tự tương quan không tồn tại trong các nhiễu ui.

Xem thêm: Vị Đắng Tiếng Anh Là Gì ? Từ Vựng Tiếng Anh Về Mùi Vị

Tự tương quan và tương quan chuỗi có khác nhau?

Mặc dù hiện nay trên thực tế thường coi các từ tự tương quan và tương quan chuỗi là đồng nghĩa, một số tác giả vẫn muốn phân biệt hai từ này. Mặc dù sự khác biệt giữa hai từ này có thể là hữu ích, trong bài này chúng ta sẽ coi chúng là đồng nghĩa.

Mặc dù việc xảy ra tự tương quan là hay có với dữ liệu chuỗi thời gian, nó vẫn có thể xảy ra trong dữ liệu chéo. Một số tác giả gọi tự tương quan trong dữ liệu chéo là tự tương quan không gian, tức là tương quan theo không gian chứ không phải là theo thời gian. Tuy nhiên, vấn đề quan trọng là cần nhớ rằng trong phân tích chéo việc sắp xếp thứ tự dữ liệu cần theo lô gich, hoặc lợi ích kinh tế nào đó, để làm cho bất cứ việc xác định xem có tồn tại tự tương quan tồn tại hay không là có ý nghĩa.

Các phương pháp kiểm tra hiện tượng tự tương quan

Đối với dữ liệu bảng : kiểm định WooldridgeĐối với dữ liệu thời gian:kiểm định Durbin-Watson, kiểm định Breusch-Godfrey

Tự tương quan là gì? | Autocorrelation là gì? Tự tương quan hay còn gọi là Autocorrelation là hiện tượng mà tại đó hạng nhiễu tại thời điểm t [hay còn gọi là sai số] thường được kí hiệu là ut có tương quan với hạng nhiễu tại thời điểm [t-1] hoặc bất kỳ hạng nhiều nào trong quá khứ.

Ví dụ: Nếu hôm nay trời mưa, dữ liệu cho thấy ngày mai trời có nhiều khả năng mưa hơn hôm nay trời quang đãng. Khi nói đến đầu tư, một cổ phiếu có thể có tỷ suất sinh lợi tự tương quan dương mạnh mẽ, cho thấy rằng nếu nó “tăng” vào ngày hôm nay, thì nhiều khả năng nó cũng sẽ tăng vào ngày mai.

Đương nhiên, tự tương quan có thể là một công cụ hữu ích cho các nhà giao dịch sử dụng; đặc biệt là đối với các nhà phân tích kỹ thuật.

MỤC LỤC BÀI VIẾT

  • 1. Tự tương quan là gì? | Định nghĩa và Nguyên nhân xuất hiện
  • 2. Hậu quả của hiện tượng tự tương quan là gì?
  • 3. Kiểm định tự tương quan và cách phát hiện tự tương quan bằng Stata
  • 4. Cách khắc phục hiện tượng tự tương quan trong stata
  • 5. Kết luận

1. Tự tương quan là gì? | Định nghĩa và Nguyên nhân xuất hiện

Hiện tượng tự tương quan trong kinh tế lượng hay còn gọi là Autocorrelation là hiện tượng mà tại đó hạng nhiễu tại thời điểm t [hay còn gọi là sai số] thường được kí hiệu là ut có tương quan với hạng nhiễu tại thời điểm [t-1] hoặc bất kỳ hạng nhiều nào trong quá khứ. Thường xảy ra trong dữ liệu bảng [panel data] và trong dữ liệu chuỗi thời gian [time-series].MOSL

Trong dữ liệu chuỗi thời gian [time-series]tự tương quan được gọi là Autocorrelation và trong dữ liệu bảng [panel-data] tự tương quan được gọi là Serial Correlation. Công thức chung như sau:

Uit = β*Uit-1 + cit

[U là hạng nhiễu tại t và t-1, Hệ số β ≠ 0 thì có TTQ và ngược lại]

[ i = 0 khi là time-series]

Hiện tượng này vi phạm giả thuyết trong mô hình hồi quy tuyến tính cổ điển giả định rằng quan hệ tự tương quan không tồn tại trong các nhiễu ui .

Hiện tượng tự tương quan và tương quan chuỗi là giống nhau tuy nhiên vẫn có 1 số tác giả định nghĩa hai cụm từ này khác nhau, trong bài viết này MOSL xem xét chúng là đồng nhất.

Tu tuong quan la gi?

Nguyên nhân của tự tương quan

Có khá nhiều nguyên nhân dẫn đến hiện tượng tự tương quan gồm:

  • Nguyên nhân do quán tính: Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quán tính mang tính chu kỳ.
  • Hiện tượng mạng nhện
  • Các độ trễ: Trong phân tích chuỗi thời gian, chúng ta có thể gặp hiện tượng biến phụ thuộc ở thời kỳ t phụ thuộc vào chính biến đó ở thời kỳ t -1 và các biến khác.
  • Xử lí số liệu: Trong phân tích thực nghiệm, số liệu thô thường được xử lý. Chẳng hạn trong hồi qui chuỗi thời gian gắn với các số liệu quý, các số liệu này thường được suy ra từ các số liệu tháng bằng cách cộng 3 quan sát rồi chia cho 3. Việc lấy trung bình này làm trơn các số liệu và làm giảm sự giao động trong số liệu tháng. Chính sự làm trơn này có thể dẫn đến sai số có hệ thống trong các sai số ngẫu nhiên và gây ra sự tương quan
  • Sai lệch do lập mô hình: Đây là nguyên nhân thuộc về việc lập mô hình.

Mở rộng khái niệm về tự tương quan

Bên cạnh khái niệm cơ bản ở trên thì tự tương quan còn có nhiều khái niệm khác như:

  • Tự tương quan được biểu diễn thành hàm tự tương quan tại đơn vị gốc và thường được sử dụng trong quy trình tự hồi quy và mô hình trung bình động [MA].
  • Tự tương quan cũng có thể được gọi là tương quan trễ hoặc tương quan nối tiếp , vì nó đo lường mối quan hệ giữa giá trị hiện tại của một biến và các giá trị trong quá khứ của nó.
  • Phân tích tự tương quan được sử dụng nhiều trong quang phổ tương quan huỳnh quang để cung cấp cái nhìn định lượng về sự khuếch tán ở cấp độ phân tử và các phản ứng hóa học.
  • Tự tương qua tín hiệu để xác định tín hiệu thời gian liên tục.
  • Ma trận tự tương quan là ma trận Hermitian cho các vectơ ngẫu nhiên phức tạp và một ma trận đối xứng cho các vectơ ngẫu nhiên thực.
  • Công thức kinh tế lượng của tự tương quan được xây dựng trên hệ số hiệp phương sai chéo.

Funfact: Lý do tại sao hiện tượng tự tương quan thường xảy ra với dữ liệu chuỗi thời gian là bởi vì dữ liệu chuỗi thời gian được sắp xếp theo t = 1 -> N nên tạo điều kiện để các hạng nhiễu U đã nói trên có tương quan với nhau cả trong quá khứ và hiện tại.

Xem thêm: Hồi quy Ma trận tương quan trong Stata

Ý nghĩa của hiện tượng tự tương quan

  • Tự tương quan, là một khái niệm thống kê, còn được gọi là tương quan nối tiếp. Nó thường được sử dụng với mô hình trung bình di chuyển tự động hồi phục [ARMA] và mô hình trung bình động tích hợp tự động hồi phục [ARIMA]. Phân tích tự tương quan giúp tìm ra các mẫu chu kỳ lặp lại, có thể được sử dụng như một công cụ phân tích kỹ thuật trên thị trường vốn .
  • Tự tương quan biểu thị mức độ giống nhau giữa một chuỗi thời gian nhất định và một phiên bản trễ của chính nó trong các khoảng thời gian liên tiếp.
  • Tự tương quan đo lường mối quan hệ giữa giá trị hiện tại của một biến và các giá trị trong quá khứ của nó.
  • Tự tương quan +1 thể hiện mối tương quan dương hoàn hảo, trong khi tự tương quan âm 1 thể hiện mối tương quan âm hoàn hảo.
  • Các nhà phân tích kỹ thuật có thể sử dụng tự tương quan để đo lường mức độ ảnh hưởng của giá trong quá khứ đối với chứng khoán lên giá tương lai của nó.

Autocorrelation là gì?

Tự tương quan +1 thể hiện  mối tương quandương hoàn hảo  [mức tăng được thấy trong một chuỗi thời gian dẫn đến mức tăng tương ứng trong chuỗi thời gian khác].

Autocorrelation là gì?

Mặt khác, tự tương quan -1 thể hiện  mối tương quan âm hoàn hảo  [sự gia tăng trong một chuỗi thời gian dẫn đến sự giảm tương ứng trong chuỗi thời gian khác].

2. Hậu quả của hiện tượng tự tương quan là gì?

Các ước lượng mô hình OLS vẫn không chệch và nhất quán theo phân phối chuẩn cho dù có hiện tượng này xảy ra.

  • Các ước lượng nói trên không còn hiệu quả nữa nghĩa là chúng không còn là ước lượng tuyến tính không chệch tốt nhất nữa [còn gọi là BLUE].
  • Các giá trị sai số chuẩn của mô hình OLS bị ước lượng thấp [underestimated], tức các giá trị t ước lượng bị thổi phồng cao hơn mức bình thường.
  • Các kiểm định giả thuyết trở nên đáng nghi vì các sai số ước lượng không còn đáng tin cậy. Do đó, kiểm định tF có thể sẽ không còn hiệu lực.
  • Các trường hợp khác có thể dẫn đến mô hình bị hiện tượng hồi quy giả mạo [spurios regression]

3. Kiểm định tự tương quan và cách phát hiện tự tương quan bằng Stata

Mặc dù có nhiều kiểm định tự tương quan, nhưng ở đây MOSL sẽ chỉ thảo luận một vài cách, cụ thể là phương pháp đồ thị [graphical method], kiểm định Durbin-Watson, và kiểm định Breusch-Godfrey.

3.1. Phương pháp vẽ đồ thị

Khi đánh giá các kết quả hồi quy thì một cách thực hành tốt là luôn luôn phải vẽ đồ thị phần dư từ mô hình.

Vì tự tương quan là sự tương quan giữa các hạng nhiễu ut, nên một phương pháp đơn giản tình thế để kiểm định tự tương quan đơn giản là vẽ các giá trị của ut theo thời gian.
Không may, chúng ta không thể quan sát các ut một cách trực tiếp mà chỉ quan sát được đại diện của chúng là et hay còn gọi là phần dư

predict s1, resid
gen s1_100=100*s1
label var s1_100 “Residuals”
predict s2, rstandard
twoway [line s1_100 time] [line s2 time]

Tu tuong quan la gi?

Xem thêm: Cách vẽ đồ thị trong Stata

Dạng đồ thị phần dư và nhận dạng loại tự tương quan

Tự tương quan dương:

Cách phát hiện tự tương quan

Tự tương quan âm:

Cách phát hiện tự tương quan

Không có tự tương quan:

Cách phát hiện tự tương quan

3.2. Kiểm định tự tương quan bằng kiểm định Durbin-Watson với dữ liệu chuỗi thời gian

Nhớ khai báo dữ liệu chuỗi thời gian bằng câu lệnh: tset timevar [trong đó timevar là biến thời gian của mô hình] cho Stata nhận nhé!

Lưu ý: Sau khi hồi quy mô hình thì mới dùng 3 cách dưới để kiểm định tự tương quan.

Giả thuyết H0:

H0 : Mô hình không xảy ra hiện tượng tự tương quan

H1: Mô hình xảy ra hiện tượng tự tương quan

Cách 1: Kiểm định bằng phương pháp Durbin-Watson

Durbin-Watson luôn tạo ra dải số thử nghiệm từ 0 đến 4. Các giá trị gần 0 cho biết mức độ tương quan dương lớn hơn, các giá trị gần 4 cho biết mức độ tự tương quan âm lớn hơn, trong khi các giá trị gần giữa hơn cho thấy mức độ tự tương quan ít hơn.

Dùng lệnh: dwstat

Cách 2: Sử dụng Durbin’s alternative để hiện mức ý nghĩa cho cách 1

Bạn có biết: Kiểm định Durbin-Watson có thể được ánh xạ tuyến tính theo mối tương quan Pearson giữa các giá trị và độ trễ của chúng.

Dùng lệnh: estat durbinalt

Funfact: Trong phần này MOSL hướng dẫn các bạn cách tra bảng kiểm định durbin watson bởi vì nó khá phức tạp và thực sự không cần thiết khi đã có các phần mềm data analysis hiện đại giúp bạn làm điều này.

Cách 3: Sử dụng kiểm định Breusch-Godfrey

Lưu ý: Tự tương quan của các bậc cao hơn và có thể áp dụng cho dù các bộ hồi quy có bao gồm độ trễ của biến phụ thuộc hay không còn được gọi là thử nghiệm Breusch-Godfrey.

Lệnh: bgodfrey

Kết quả từ cách 2 và cách 1 đều cho p-value < 0.05 nên ta bác bỏ H0 và kết luận mô hình xảy ra hiện tượng tự tương quan.

3.3. Kiểm định tự tương quan bằng lệnh xtserial với dữ liệu bảng

Sử dụng bộ dữ liệu bảng và setup dữ liệu cho Stata hiểu bằng câu lệnh: xtset bank YEAR

Sau khi hồi quy mô hình dùng lệnh: xtserial [BPT] + [BĐL] như hình dưới

Kết quả với bộ dữ liệu này thì p-value = 0.0849 > 0.05 nên chấp nhận H0 và kết luận mô hình không xảy ra hiện tượng tự tương quan.

4. Cách khắc phục hiện tượng tự tương quan trong stata

Giống như trong trường hợp của phương sai thay đổi, bạn cần sử dụng đến ước đoán dựa trên cơ sở kinh nghiệm [educated guess] hoặc một loại chuyển hóa nào đó về mô hình hồi quy gốc để trong mô hình đã được chuyển hóa không còn gặp phải vấn đề tương quan chuỗi nữa. Có nhiều cách khắc phục như sau:

Xem thêm: Phương sai thay đổi là gì?

4.1. Chuyển hóa sai phân bậc 1

Với cách này bạn sẽ đưa toàn bộ dữ liệu về dạng sai phân bậc 1 tức là lấy hiệu số giữa hai kỳ quan sát thứ t và t-1 cho mỗi biến trong mô hình.

May thay trong Stata bạn không cần làm phức tạp như vậy mà chỉ cần dùng lệnh D. ở phía trước các biến như sau:

reg D.Y D.X1 D.X2 D.X3

4.2. Chuyển hóa tổng hóa

Các giá trị ước lượng p của các tham số thu được vì thế được biết với tên gọi là các ước lượng bình phương bé nhất tổng quát khả thi viết tắt là FGLS [Feasible Generalized Least Squares estimators].

Tham khảo ngay nếu chưa biết Mô hình FGLS là gì?nhé!

Trong phần mềm Stata đối với dữ liệu bảng ta có lệnh sau để khắc phục hiện tượng tự tương quan:

xtgls [BPT][BĐL],corr[ar1]

Với giả định ut theo cơ chế AR[1] là phù hợp, hồi quy et theo et-1, sử dụng et làm biến đại diện cho ut, một giả định có thể phù hợp trong các mẫu lớn, bởi vì trong các mẫu lớn 𝜌̂ là ước lượng nhất quán của giá trị ước lượng p.

4.3. Phương pháp Newey-West để điều chỉnh các số chuẩn của OLS

Nhưng nếu cỡ mẫu lớn, thì bạn có thể ước lượng hồi quy OLS theo cách thông thường, nhưng điều chỉnh các sai số chuẩn của các hệ số hồi quy, theo một phương pháp được đề xuất bời Newey và West. Các sai số chuẩn được điều chỉnh theo thủ tục của họ cũng được biết với tên gọi các sai số chuẩn HAC [heteroscedasticity and autocorrelation consistent]. Nói chung, nếu có tự tương quan, các sai số theo phương pháp HAC được tìm thấy lớn hơn các sai số chuẩn theo phương pháp OLS thông thường.

Thực hiện bằng 1 trong 2 cách sau trong phần mềm Stata:

reg Y X1 X2 X3, vce[robust] hoặc ewey Y X1 X2 X3 , lag[n]

Khi dùng lệnh newey phải thêm giá trị biến trễ thấp nhất là 1 để thay đổi bậc tương quan.

4.4. Thêm biến trễ vào biến phụ thuộc trong mô hình

Có thể thêm biến trễ cho biến phụ thuộc trong trường hợp biến này bị tương quan giữa hai giai đoạn t và t -1 với lệnh như sau:

reg Y  L.Y X1 X2 X3             [Nếu chỉ muốn biến phụ thuộc với độ trễ 1]

reg Y  L[1/2].Y X1 X2 X3       [Nếu muốn biến phụ thuộc với độ trễ 1 và 2]

Sau khi thêm biến trễ vào biến phụ thuộc nhớ dùng kiểm định test lại nhé!

Xem thêm: Cách khắc phục và kiểm định tự tương quan trong các phần mềm khác như R, SPSS, EVIEW…

5. Kết luận

Như vậy MOSL đã giới thiệu cho các bạn hiện tượng tự tương quan là gì – nguyên nhân, hậu quả và cách phát hiện cũng như khắc phục trong phần mềm Stata.

Hy vọng với bài viết này các bạn sẽ nắm bắt rõ được tự tương quan là gì và áp dụng vào giải bài tập được giao!

MOSL xin chúc các bạn học tập và làm việc hiệu quả!

Xem thêm: Dịch vụ chạy Stata của Mosl.vn

Chủ Đề