Df trong SPSS là gì
Ngày đăng:
27/11/2021
Trả lời:
0
Lượt xem:
254
Show
Kiểm định Chi bình phương Chi Square test: cách thực hiện, cách đọc kết quả, cách thao tác tính toán bằng tay thay vì dùng SPSSNhóm MBA ĐH Bách Khoa giới thiệu chi tiết về kiểm định chi bình phương. Đọc xong bài này các bạn sẽ hiểu rõ nó, không còn mơ hồ về mục đích và phương pháp thực hiện( kể cả làm bằng thủ công hoặc bằng phần mềm SPSS) Mục đíchGiả sử chúng ta có 100 người , và có trình độ học vấn khác nhau tại một tỉnh nọ. Câu hỏi đặt ra là có sự liên quan giữa giới tính và trình độ học vấn hay không. Lúc đó ta sẽ dùng kiểm định chi bình phương ( có nhà nghiên cứu đọc là khi bình phương, khi square). Bài này sẽ dùng hai cách:-Cách tính toán bằng tay để ra được chỉ số chi-square, df, sig. -Cách làm bằng SPSS để ra kết quả, để các bạn nắm chắc hơn kiến thức về phần Chi Square này Cách thực hiện kiểm định chi-square bằng phần mềm SPSSĐầu tiên các bạn load file dữ liệu ở đây: phantichspss.com/filefordownload/chisquare/ChiSquare.sav Đầu tiên vào menu Analyze- Descriptive Statistics Crosstabs, sau đó đưa hai biến giới tính , bằng cấp GIOITINH và BANGCAP vào hai ô tương ứng như trên hình. Sau đó nhấn vào nút Statistics, chọn Chi-square để thực hiện kiểm định. Chọn ô Cells và nhấn chọn Observed, Expected và Total như trong hình. Về ý nghĩa thì Observed là số lượng thực tế quan sát, Expected là số lượng kì vọng, Total là tổng phần trăm theo từng dòng và từng cột. Giá trị expected sẽ được nhóm MBA tính toán bằng tay ở bước sau để cho các bạn hiểu rõ. Kết quả ra như sau: Các giá trị ở ô màu đỏ là giá trị thực tế quan sát được. Ví dụ số 6 ở hàng màu đỏ đầu tiên. Đó là có 6 người Nam học CAO ĐẲNG. Số 35 bên tay phải của số 6 có nghĩa là có 35 người Nam học ĐẠI HỌC. Các giá trị ở ô màu xanh là giá trị kì vọng mong đợi . Ví dụ số 5.6 ở hàng màu xanh đầu tiên. Đó là có 5.6 người Namkì vọng học CAO ĐẲNG. Số 38.6 bên tay phải của số 5.6 có nghĩa là có 38.6 người Namkì vọng học ĐẠI HỌC. Giá trị kì vọng expected cũng khá dễ hiểu, đó là khi có giả thiết độ tuổi và trình độ không có quan hệ với nhau. Thì xác suất xuất hiện của độ tuổi và giới tính độc lập nhau. Lúc đó công thức tính xác suất P(gioitinh & dotuoi)=P(gioitinh)*P(dotuoi) . Về kết quả kiểm định chi-square trong phần hình màu vàng. Giá trị Asymptotic Significance (2-sided) = 0.238 chính là significane 2 đuôi của kiểm định. Kiểm định Chi-bình phương chỉ có ý nghĩa khi số quan sát đủ lớn, nếu có nhiều hơn 20% số ô trong bảng chéo có tần suất mong đợi expected value nhỏ hơn 5 thì giá trị chi-square nói chung không còn đáng tin cậy. Cuối bảng Chi-Square Tests luôn đưa ra một dòng thông báo cho bạn biết có bao nhiêu % số ô có tần suất mong đợi expected value dưới 5 của bảng. Nếu số này dưới 20% thì chúc mừng bạn. Còn nếu trên 20% bạn phải tính đến các biện pháp khác, như là sử kiểm định Fishers exact test. ( nếu bảng dữ liệu 2×2 thì fisher sẽ tự hiện ra sau giá trị chi square trong bảng kết quả này). Ở đây ta thấy có 3 giá trị cần lưu ý: giá trị chi square là 2.873, giá trị bậc tự do df là 2, giá trị sig. là 0.238. Do sig. > 5% nên có bằng chứng cho thấy hai biến này độc lập với nhau. Do đó kết luận giữa HỌC VẤN và GIỚI TÍNH không có quan hệ với nhau. Còn nếu sig<5% thì có bằng chứng cho thấy hai biến này không độc lập với nhau. Ở phần sau nhóm sẽ tính bằng tay 3 giá trị chi square, bậc tự do và sig. này để các bạn xem nhé. Cách thực hiện kiểm định chi-square bằng thủ công.Các bạn tải file excel hướng dẫn thủ công ở đâyphantichspss.com/filefordownload/chisquare/ChiSquare.xlsx Phần này sẽ tính toán các giá trị Chi square, bậc tự do và sig. của kiểm định chi-square. Dữ liệu gốc ban đầu là 100 người được phân bố như sau Tổng cộng có 100 người nhé. Từ dữ liệu trên, tính được % theo dòng vào theo cột như sau( ô màu vàng) Ví dụ ô có vòng tròn đỏ là 10%, nghĩa là có 10% trong 100 người này có trình độ CAO ĐẲNG số này bằng (6+4)/100 Từ các số màu vàng đó, tính ngược lại ra các số kì vọng expected là các số màu đỏ như trên hình. Ví dụ số 5.6 trong vòng tròn màu xanh là bằng 10%x56%x100. Các bạn để ý các số màu đỏ này chính là các số được tính tự động dùng SPSS ở trên , là giá trị expected. Lưu ý P(A&B)=P(A)*P(B) nếu A và B độc lập với nhau. Giả sử A, B độc lập thì mới được bảng trên.Nếu kì vọng i chang quan sát: thì hai biến hoàn toàn không liên quan nhau .Nếu không chang: thì có liên quan nhau, thì không độc lập với nhau Áp dụng công thức tính chi bình phương như sau: Ta tính được chi-square= (6-5.6)*(6-5.6)/5.6+(35-38.64)*(35-38.64)/38.64+(15-11.76)*(15-11.76)/11.76+(4-4.4)*(4-4.4)/4.4+(34-30.36)*(34-30.36)/30.36+(6-9.24)*(6-9.24)/9.24= 2.873 Vậy giá trị chi-square=2.873, giống với giá trị chạy tự động ở trên Tính giá trị bậc tự do degree of freedom= (3-1)*(2-1)=2 . Số 3 ở đây là do có ba bậc học, số hai là do có hai giới tính. Để tính được sig. ta dùng hàm chidist trong excel CHIDIST(chi-square,df) = CHIDIST(2.873,2)=0.238 Như vậy đã đủ điều kiện để kết luận hai giá trị Học vấn và Giới tính không có liên quan với nhau Như vậy đã giúp các bạn hiểu được bản chất của vấn đề. Ngoài ra nếu các bạn muốn tìm hiểu thêm về các kiểm định liên quan , như là kiểm định fishers exact test, df tính ra sao. thì có thể mail cho nhóm Thạc Sĩ QTKD ĐH Bách Khoa tại địa chỉ , có thể để lại số alo, viber, facebook nhóm sẽ trả lời ngay nhé. Ngoài ra nhóm có các dịch vụ sau: Tư vấn mô hình/bảng câu hỏi/ traning trực tiếp về phân tích hồi quy, nhân tố, cronbach alpha trong SPSS, và mô hình SEM, CFA, AMOS Cung cấp/chỉnh sửa số liệu khảo sát để chạy ra kết quả có ý nghĩa thống kê. So sánh quan hệ giữa 7 phương pháp phân tích đa biến : Regression, Discriminant, Conjoint, SEM, ANOVA, MANOVA, Canonical CorrelationAMOS, SPSSanova, Canonical Correlation, Conjoint, Discriminant, MANOVA, Regression, SEM Edit Hôm nay nhóm Thạc Sĩ ĐH Bách Khoa TP.HCM () giới thiệu đến các bạn sự khác nhau giữa các phương pháp đa biến, để các bạn có thể chủ động chọn phương pháp nghiên cứu cho luận văn của mình nhé. Mỗi phương pháp phân tích định lượng chỉ phù hợp với một số loại dữ liệu, loại mô hình, loại biến độc lập và biến phụ thuộc nhất định. Phương pháp thông dụng là hồi quy regession. Tuy nhiên có một số nghiên cứu phương pháp này không xử lý được, cụ thể có 7 phương pháp như sau. 1.Multiple Regression Analysis Hồi quy đa biếnPhương trình toán hoc:
2.Mô hình cấu trúc tuyến tính Structural Equation ModelingPhương trình toán hoc:Gồm nhiều phương trình hồi quy đa biến tập hợp lại với nhau, mỗi phương trình có:
3.Phân tích biệt số Discriminant AnalysisPhương trình toán hoc:
4.Phân tích kết hợp Conjoint AnalysisPhương trình toán hoc:
5.Phân tích phương sai Analysis of Variance (ANOVA)Phương trình toán hoc:
6.Phân tích phương sai đa biến Multivariate Analysis of Variance (MANOVA)Phương trình toán hoc:
7. Phân tích tương quan chính tắc Canonical CorrelationPhương trình toán hoc:
Tư vấn mô hình/bảng câu hỏi/ traning trực tiếp về phân tích hồi quy, nhân tố, cronbach alpha trong SPSS, và mô hình SEM, CFA, AMOS Cung cấp/chỉnh sửa số liệu khảo sát để chạy ra kết quả có ý nghĩa thống kê. Hôm nay nhóm Thạc Sĩ ĐH Bách Khoa tp.HCM hướng dẫn cách xử lý khi ma trận xoay trong phân tích nhân tố xoay ra số liệu xấu, các nhân tố không hội tụSau khi chạy Cronbach alpha ổn, điều mong đợi nhất chạy phân tích nhân tố EFA các kết quả ra đẹp, ma trận xoay hội tụ, không bị xáo trộn lộn xộn.( bạn nào chưa biết cách chạy EFA thì xem link ở đây http://phantichspss.com/tong-quan-phan-tich-nhan-to-kham-pha-efa.html ) Nếu kết quả bạn chạy ra , biến quan sát bị xáo trộn như sau: Ta thấy nhiều câu hỏi bị xáo trộn, giá trị các biến không hội tụ lại được,ma trận xoay không theo từng nhóm biến. Trong khi mong ước của bài là như sau: Như ta thấy, mô hình ban đầu chỉ có 6 biến độc lập, sau khi thực hiện xoay nhân tố lại ra tới 12 nhóm, không thể giải thích được. Nguyên nhân:Số liệu có vấn đề, cần phải xem lại bảng câu hỏi, thậm chí khảo sát lại.Giải pháp:Xem lại toàn bộ số liệu, kiểm tra lại quá trình thu thập bảng câu hỏiGởi mail cho nhóm để được tư vấn xử lý, xử lý dứt điểm Ngoài ra nhóm Thạc Sĩ ĐH Bách Khoa tp.HCM còn có dịch vụ tư vấn bảng câu hỏi, hiệu chỉnh số liệu khảo sát cho ổn. Các bạn mail nhé. Nhóm Hỗ Trợ SPSS hotrospss @gmail.com Các nội dung nhóm thường tư vấn, hướng dẫn xử lý cho các bạn như sau: Ma trận xoay rồi thì thấy nó Lộn xộn quá! biến quan sát bị xáo trộn ma tran nhân tố xoay nó không hội tụ mà phân tùm lum hết nhiều biến không có hệ số. ma trận xoay các nhân tố cho ra kết quả các nhóm rất không tốt, lộn xộn. ma trận xoay không theo từng nhóm biến cái bảng xoay nhân tố Rotated Component Matrixa nó ra rất lộn xộn, có 1 biến mà thuộc 2 nhóm nhân tố Một số câu hỏi bị xáo trộn Efa bảng dữ liệu đã xoay số liệu rất xấu nhưng khi khắc phục xong ma trận xoay của em còn rất ít yếu tố mà giá trị các biến không hội tụ lại được ma trận xoay cũng không ra luôn à. ma trận xoay đúng trật tự các nhân tố ban đầu Bảng xoay EFA cuối cùng của em các biến bị sắp xếp lộn xộn không cùng một nhóm Khi tiến hành phân tích nhân tố, một số trường hợp sẽ bị lỗi là chỉ số KMO không xuất hiện trong bảng kết quả , trong khi mọi chỉ số khác đều đầy đủ. Vậy làm thế nào để KMO hiện ra? Nay nhóm MBA Bách Khoa sẽ hướng dẫn bạn cách tự xử lý: Khi KMO không xuất hiện, kết quả như sau: KMO xuất hiện, mong muốn được như sau: Nguyên nhân do một trong ba vấn đề chính sau đây làm cho KMO không hiển thị khi phân tích nhân tố EFA. Lý do 1:Có hai biến quan sát giá trị hòa toàn giống nhau, đây là điều dễ gặp khi các bạn chế số để ra kết quả chạy đẹp. Để biết được điều này thì các bạn thực hiện thống kê mô tả cho tất cả các biến, trong phần options chọn Ascending meansSau đó xem kết quả , xem hai giá trị nào có cùng giá trị trung bình mean và độ lệch chuẩn Std. Deviation. Thì đây là hai đối tượng nghi ngờ gây ra chuyện giá trị KMO không xuất hiện.( bạn nào chưa biết chạy thống kê mô tả thì xem ở đây nhé:http://phantichspss.com/huong-dan-cach-chay-thong-ke-mo-ta-trong-spss.html ) Lý do 2:Có một hoặc nhiều biến có độ lệch chuẩn bằng 0. Các bạn cũng dùng thống kê mô tả ở trên để tìm ra nó( tìm biến nào có Std. Deviation=0)Và khi chỉ số KMO disappear, nếu các bạn tinh mắt sẽ thấy có một giá trị khác thay vào nó, và cũng ko xác định được, đó là giá trị Correlation Matrix: a. This matrix is not positive definite. Các bạn không cần quan tâm đến ma trận này nhé. Lý do chính của hai vấn đề trên là do số liệu SPSS được sửa lại để chạy kiểm định Cronbachs alpha., điều này rất nguy hiểm, bởi vì số liệu cần phải đạt được tính thống nhất trong tất cả các bước của một bài luận văn: cronbach, efa, tương quan, hồi quy Chỉ cần một bước dữ liệu bị thay đổi là các bước sau bị ảnh hưởng hết. Lý do 3:Lý do này hơi ngớ ngẩn, đó là do khi phân tích nhân tố bạn chưa tick vào chọn hiển thị KMO như sau:Đặc biệt:Gởi mail cho nhóm MBA Bách Khoa để được tư vấn hướng dẫn xử lý số liệu, đào tạo trực tiếp cho việc làm luận văn với SPSS hoặc AMOS nhé.Dịch spss Tiếng Việt Khi làm luận văn, chạy các bước cronbachs alpha, EFA, tương quan, hồi quy, một số trường hợp giáo viên sẽ yêu cầu dịch các bảng biểu qua tiếng Việt. Do đó nhóm hỗ trợ SPSS dịch một số thuật ngữ trong phần kết quả của SPSS qua tiếng Việt. Có chỗ nào chưa rõ các bạn cứ mail về nhóm tại địa chỉ nhé
Gởi mail ngay cho nhóm MBA để được hướng dẫn: Khảo sát thị trường/ xử lý/hiệu chỉnh số liệu khảo sát để chạy ra kết quả phân tích nhân tố hội tụ,phân tích hồi quy hồi quy có ý nghĩa thống kê. Tư vấn mô hình/bảng câu hỏi/traning trực tiếp về phân tích hồi quy, nhân tố, cronbach alpha trong SPSS, và mô hình SEM, CFA, AMOSNhóm MBA ĐH Bách Khoa giới thiệu cách: Chuyển 1 biến dạng phân loại (Category) thành dạng biến lưỡng phân (Dichotomy). Biến category là biến có nhiều biển hiện, ví dụ Xanh, Đỏ, Vàng. Biến Dichotomy là biến chỉ có 2 biểu hiện, ví dụ có màu hoặc không có màuĐược dùng khi gặp câu hỏi có nhiều trả lới (MA) để tập hợp một thông tin chứa trong các câu trả lời, muốn vậy cần tạo một biến với 2 biểu hiện: 1 có thông tin và 0 không có thông tin, đếm 1 sẽ có được thông tin cần quan tâm; Cách tiến hànhĐầu tiên các bạn download file thực hành Hoàng Trọng ở đây http://phantichspss.com/filefordownload/Data%20thuc%20hanh.sav Sau đó mở file. Vào menu Transform \ count Khai tên biến Dichotomy trong Target Variable (docTTre) và nhãn biến trong Target Label (Nguoi doc bao TTre). Vào Define Values Value: nhập 7 (là mã hóa của báo Tuổi trẻ), nhấn Add để chuyển vào Values to Count. Continue. OK. Biến docTTre được tạo ra ở cuối Variable View, khai báo tiếp Value với 2 biểu hiện của biến: 0 không đọc báo Tuổi trẻ và 1 có đọc báo Tuổi trẻ. Sau đây là phần video hướng dẫnHôm nay nhóm giới thiệu video về cách thực hành chạy hồi quy binary logistic. Mô hình này dùng khi biếnphụ thuộc dạng nhị phân, chỉ có hai giá trị 0 hoặc 1. Bên dưới có hướng dẫn chi tiết ý nghĩa các bảng được đề cập trong video. Về mô hình: đây là mô hình xác định khả năng trả nợ dựa vào 6 yếu tố độc lập. Mô hình có 6 biến độc lập: THUNHAP, TUOI, TAISAN, DIENTICHDAT, HOCVAN, SOLUONGBATDONGSANVà 1 biến phụ thuộc là TRANO. Biến phụ thuộc dạng nhị phân có hai giá trị 0 và 1 tương ứng với không trả được nợ và trả được nợ. Khi chạy ra các kết quả sau: -Omnibus Tests of Model Coefficients:Giống kiểm định F bên hồi quy đa biến, sig<5% nên bác bỏ giả thiết Ho: B1=B2=B3=0
Chỉ số -2 Log likelihood: càng nhỏ càng tốt,cách tính ngược lại với R bình phương của hồi quy đa biến. Nếu nhỏ thì thể hiện độ phù hợp khá tốt của mô hình tổng thể BảngClassification Tablecho thấy phân loại đối tượng trả được nợ và không trả được nợ theo hai tiêu chí : quan sát thực tế và dự đoán
Ý nghĩa: Trong 90 trường hợp quan sát ko trả được nợ, thì dự đoán có 76 trường hợp không trả được, vậy tỉ lệ dự đoán đúng là 76/90=84.4 Trong 81 trường hợp quan sát trả được nợ, dự đoán có 62 trường hợp trả được, vậy tỉ lệ dự đoán đúng là 62/81=76.5 Vậy trung bình dự đoán đúng (84.4+76.5)/2=80.7 phần trăm
Ví dụ một người có các thông tin cá nhân như sau, ta sẽ dùng kết quả phương trình hồi quy để dự đoán khả năng trả nợ:
Hàm xác suất trả nợ Thế vào, kết quả E(Y/X)= 4.90/5.90=0.83 Kết luận, khả năng trả nợ của người này là 83%, và đây là khả năng trả nợ dự đoán, và dự đoán này đúng 80.7% @liên hệ nhóm MBA để được hỗ trợ khi xử lý số liệu, để đạt được ý nghĩa thống kê khi phân tích hồi quy logistic với SPSS tại mail Hôm nay nhóm giới thiệu video về cách thực hành chạy hồi quy binary logistic. Mô hình này dùng khi biếnphụ thuộc dạng nhị phân, chỉ có hai giá trị 0 hoặc 1. Bên dưới có hướng dẫn chi tiết ý nghĩa các bảng được đề cập trong video. Về mô hình: đây là mô hình xác định khả năng trả nợ dựa vào 6 yếu tố độc lập. Mô hình có 6 biến độc lập: THUNHAP, TUOI, TAISAN, DIENTICHDAT, HOCVAN, SOLUONGBATDONGSANVà 1 biến phụ thuộc là TRANO. Biến phụ thuộc dạng nhị phân có hai giá trị 0 và 1 tương ứng với không trả được nợ và trả được nợ. Khi chạy ra các kết quả sau: -Omnibus Tests of Model Coefficients:Giống kiểm định F bên hồi quy đa biến, sig<5% nên bác bỏ giả thiết Ho: B1=B2=B3=0
Chỉ số -2 Log likelihood: càng nhỏ càng tốt,cách tính ngược lại với R bình phương của hồi quy đa biến. Nếu nhỏ thì thể hiện độ phù hợp khá tốt của mô hình tổng thể BảngClassification Tablecho thấy phân loại đối tượng trả được nợ và không trả được nợ theo hai tiêu chí : quan sát thực tế và dự đoán
Ý nghĩa: Trong 90 trường hợp quan sát ko trả được nợ, thì dự đoán có 76 trường hợp không trả được, vậy tỉ lệ dự đoán đúng là 76/90=84.4 Trong 81 trường hợp quan sát trả được nợ, dự đoán có 62 trường hợp trả được, vậy tỉ lệ dự đoán đúng là 62/81=76.5 Vậy trung bình dự đoán đúng (84.4+76.5)/2=80.7 phần trăm
|