Các mối tương quan được phân loại thành hai dạng trong thống kê, tức là tương quan hai biến và một phần. Tương quan là phạm vi và hướng liên kết của hai biến số – nói cách khác, có thể tính toán hiệu quả của biến này từ biến kia.
Mối quan hệ được chia sẻ giữa hai biến có thể tích cực, lạc quan hoặc đường cong. Thang đo số được sử dụng để đo lường và thể hiện nó. Các mối tương quan được cho là dương khi chúng tăng đồng thời và âm khi chúng giảm giá trị.
Các nội dung chính
- Tương quan hai biến kiểm tra mối quan hệ giữa hai biến, trong khi tương quan một phần đánh giá kết nối sau khi kiểm soát một hoặc nhiều biến.
- Tương quan hai chiều có thể bị ảnh hưởng bởi các yếu tố gây nhiễu, nhưng tương quan một phần sẽ loại bỏ ảnh hưởng của chúng để cung cấp thông tin chi tiết rõ ràng hơn.
- Tương quan từng phần phức tạp hơn để tính toán và giải thích so với tương quan hai biến, đòi hỏi các kỹ thuật thống kê bổ sung.
Bivariate vs Tương quan một phần
Tương quan hai biến là một phương pháp thống kê được sử dụng để đo lường cường độ và hướng của mối quan hệ tuyến tính giữa hai biến. Tương quan một phần là một phương pháp thống kê được sử dụng để đo lường mối quan hệ giữa hai biến trong khi kiểm soát tác động của một số biến.

Một mối tương quan hai biến được áp dụng để xác định xem hai biến có liên quan hay không. Nó đánh giá các biến thay đổi như thế nào cùng một lúc.
Việc kiểm tra thông qua phương pháp hai biến giúp khám phá đồng thời nhiều yếu tố. Phân tích này' cố gắng xác định mối quan hệ tuyến tính giữa hai biến.
Tương quan một phần khác với bivariate; nó loại bỏ biến phụ để biểu thị mối tương quan giữa hai biến. Phương pháp này giúp tính toán mối tương quan giữa các biến bằng cách loại bỏ ảnh hưởng của biến thứ ba.
Nó có thể thực hiện đáng ngưỡng mộ trong nhiều hồi quy. Theo loại tương quan này, dữ liệu có giá trị được tích lũy để khám phá các mối quan hệ ẩn và xác định các mối tương quan.
Bảng so sánh
Tương quan Bivariate là gì?
Mối tương quan hai chiều phù hợp để đánh giá các giả định đơn giản về mối liên kết và quan hệ nhân quả. Một phân tích hai chiều đi xa hơn trong mô tả; nó kiểm tra đồng thời nhiều mối quan hệ giữa nhiều biến.
Chiều dài và chiều rộng của một đối tượng là hai ví dụ về liên kết hai chiều.
Khi một biến là tùy ý hoặc một trong hai biến khó đo lường, tương quan hai chiều có thể giúp hiểu và dự đoán kết quả của các biến khác.
Mối tương quan hai biến có thể được đo bằng nhiều thử nghiệm khác nhau, chẳng hạn như biểu đồ phân tán và thử nghiệm Tương quan thời điểm sản phẩm Pearson. Một ma trận tương quan được sử dụng để thể hiện kết quả thử nghiệm của mối tương quan này.
Mối tương quan là một giá trị duy nhất giữa -1 và +1 phản ánh cường độ liên kết hoặc cùng xuất hiện giữa hai biến.
Thống kê này, định lượng mức độ liên kết, được gọi là hệ số tương quan và thường được ký hiệu bằng chữ 'r'.
Hệ số tương quan thời điểm sản phẩm Pearson là tên thứ hai của hệ số tương quan giữa hai biến cấp độ liên tục.
Giá trị r dương biểu thị mối liên hệ tích cực giữa hai biến (A càng xuất sắc thì B càng xuất sắc). Ngược lại, giá trị r âm biểu thị mối quan hệ âm (A càng lớn, B càng nhỏ).
Giá trị tương quan bằng 0 cho thấy không có mối quan hệ nào giữa các thành phần. Mặt khác, các mối tương quan được giới hạn trong các mối quan hệ tuyến tính giữa các biến. Một mối quan hệ phi tuyến tính có thể tồn tại ngay cả khi hệ số tương quan bằng không.
Tương quan một phần là gì?
Khi ảnh hưởng của các biến liên quan bị loại bỏ khỏi phương trình, mối tương quan giữa hai biến được gọi là tương quan từng phần. Nó thực hiện đáng ngưỡng mộ trong nhiều hồi quy.
Đó là một kỹ thuật để giải thích mối quan hệ giữa các biến độc lập trong khi bỏ qua tác động của một biến khác trong mối quan hệ.
Nó tích lũy các biến để xác định xem chúng có thể hiện hành vi tập thể hay không. Tương quan một phần rất hữu ích trong việc khám phá các kết nối bị che giấu và phát hiện các mối tương quan lừa đảo.
Mối quan hệ giữa cân nặng và chiều cao của một người sau khi kiểm soát giá trị của tuổi minh họa một phần mối tương quan.
Giả sử chúng ta muốn xác định mức độ mạnh mẽ của mối quan hệ giữa hai biến quan tâm bằng cách sử dụng hệ số tương quan của chúng. Trong trường hợp đó, nó sẽ cung cấp các kết quả sai lệch nếu có thêm một biến nữa, đó là một biến khó hiểu và có liên quan về mặt số học với cả hai biến quan tâm.
Việc kiểm soát biến ảnh hưởng, được thực hiện bằng cách tính toán hệ số tương quan từng phần, có thể giúp tránh làm sai lệch dữ liệu.
Đây là lý do tại sao hồi quy bội bao gồm các biến phụ bên phải; tuy nhiên, trong khi hồi quy bội cho kết quả không sai lệch về quy mô tác động, nó sẽ không đưa ra giá trị bằng số cho mức độ quan hệ giữa hai biến quan tâm.
Mối tương quan từng phần có giá trị từ –1 đến 1. Giá trị –1 biểu thị mối tương quan âm lý tưởng kiểm soát các biến cụ thể, 1 biểu thị mối quan hệ tuyến tính dương hoàn hảo và 0 biểu thị sự vắng mặt của mối quan hệ tuyến tính.
Sự khác biệt chính giữa Bivariate và Partial Correlation
- Một mối tương quan hai chiều xác định xem hai biến có được kết nối hay không. Mặt khác, tương quan một phần được sử dụng để định lượng mối quan hệ sau khi hiệu chỉnh cho các biến khác.
- Tương quan hai biến là phép đo hoặc phân tích hai biến. Tuy nhiên, tương quan một phần đánh giá mức độ hiện diện của các yếu tố bổ sung.
- Các biến như X và Y thường được sử dụng trong tương quan hai chiều. Tương quan một phần liên quan đến việc sử dụng các biến ngẫu nhiên, chẳng hạn như X và Y, X và Z hoặc Y và Z.
- Ký hiệu cho tương quan Bivariate là 'r' (R) của Pearson và cho tương quan một phần, đó là 'rYX.W'.
- Tương quan hai biến được sử dụng để tính toán hệ số tương quan, cung cấp mức độ liên kết giữa hai biến tuyến tính. Sau khi điều chỉnh cho một hoặc nhiều biến, tương quan từng phần được sử dụng để lấy các hệ số tương quan.
- https://onlinelibrary.wiley.com/doi/abs/10.1002/jrsm.1126
- https://www.tandfonline.com/doi/abs/10.1207/s15327906mbr3803_02