Chi Square Test στο Excel - Πώς να κάνετε δοκιμή Chi Square με παράδειγμα

Πίνακας περιεχομένων

Δοκιμή Chi-Square με Excel

Η δοκιμή Chi-Square στο excel είναι η πιο συχνά χρησιμοποιούμενη μη παραμετρική δοκιμή που χρησιμοποιείται για τη σύγκριση δύο ή περισσότερων μεταβλητών για τυχαία επιλεγμένα δεδομένα. Είναι ένας τύπος δοκιμής που χρησιμοποιείται για να ανακαλυφθεί η σχέση μεταξύ δύο ή περισσότερων μεταβλητών, χρησιμοποιείται σε στατιστικές που είναι επίσης γνωστές ως Chi-Square P-value, στο excel δεν έχουμε ενσωματωμένη συνάρτηση αλλά μπορούμε να χρησιμοποιήσουμε τύποι για να εκτελέσετε τεστ τετραγώνου στο Excel χρησιμοποιώντας τον μαθηματικό τύπο για τη δοκιμή Chi-Square.

Τύποι

  1. Chi-Square τεστ για την καλή εφαρμογή
  2. Δοκιμή Chi-Square για ανεξαρτησία δύο μεταβλητών.

# 1 - Δοκιμή τετραγώνου Chi για καλή φυσική κατάσταση

Χρησιμοποιείται για να αντιληφθεί την εγγύτητα ενός δείγματος που ταιριάζει σε έναν πληθυσμό. Το σύμβολο της δοκιμής Chi-Square είναι (2). Είναι το άθροισμα όλων των ( Παρατηρούμενος αριθμός - Αναμενόμενος αριθμός) 2 / Αναμενόμενος αριθμός.

  • Όπου k-1 βαθμούς ελευθερίας ή DF.
  • Όπου το Oi είναι η παρατηρούμενη συχνότητα, το k είναι κατηγορία και το Ei είναι η αναμενόμενη συχνότητα.

Σημείωση: - Η καλή εφαρμογή ενός στατιστικού μοντέλου αναφέρεται στην κατανόηση του πόσο καλά τα δείγματα δεδομένων ταιριάζουν σε ένα σύνολο παρατηρήσεων.

Χρήσεις

  • Η πιστοληπτική ικανότητα των δανειοληπτών βάσει των ηλικιακών ομάδων και των προσωπικών δανείων τους
  • Η σχέση μεταξύ της απόδοσης των πωλητών και της κατάρτισης που λαμβάνεται
  • Επιστροφή σε ένα απόθεμα και σε αποθέματα ενός τομέα όπως φαρμακευτική ή τραπεζική
  • Κατηγορία θεατών και ο αντίκτυπος μιας τηλεοπτικής καμπάνιας.

# 2 - Δοκιμή Chi-Square για ανεξαρτησία δύο μεταβλητών

Χρησιμοποιείται για να ελέγξει αν οι μεταβλητές είναι αυτόνομες μεταξύ τους ή όχι. Με (r-1) (c-1) βαθμούς ελευθερίας

Όπου το Oi είναι η παρατηρούμενη συχνότητα, το r είναι ο αριθμός των σειρών, το c είναι ο αριθμός των στηλών και το Ei είναι η αναμενόμενη συχνότητα

Σημείωση: - Δύο τυχαίες μεταβλητές ονομάζονται ανεξάρτητες εάν η κατανομή πιθανότητας μιας μεταβλητής δεν επηρεάζεται από την άλλη.

Χρήσεις

Το τεστ ανεξαρτησίας είναι κατάλληλο για τις ακόλουθες καταστάσεις:

  • Υπάρχει μια κατηγορηματική μεταβλητή.
  • Υπάρχουν δύο κατηγορικές μεταβλητές και θα πρέπει να καθορίσετε τη σχέση μεταξύ τους.
  • Υπάρχουν διασταυρώσεις και πρέπει να βρεθεί η σχέση μεταξύ δύο κατηγορηματικών μεταβλητών.
  • Υπάρχουν μη ποσοτικοποιήσιμες μεταβλητές (Για παράδειγμα, απαντήσεις σε ερωτήσεις όπως, οι εργαζόμενοι σε διαφορετικές ηλικιακές ομάδες επιλέγουν διαφορετικούς τύπους προγραμμάτων υγείας;)

Πώς να κάνετε τη δοκιμή Chi-Square στο Excel; (με παράδειγμα)

Ο διευθυντής ενός εστιατορίου θέλει να βρει τη σχέση μεταξύ της ικανοποίησης των πελατών και των μισθών των ατόμων που περιμένουν τραπέζια. Σε αυτό, θα ρυθμίσουμε την υπόθεση για να δοκιμάσουμε το Chi-Square

  • Παίρνει ένα τυχαίο δείγμα 100 πελατών που ρωτά αν η υπηρεσία ήταν εξαιρετική, καλή ή κακή.
  • Στη συνέχεια κατηγοριοποιεί τους μισθούς των ατόμων που περιμένουν ως χαμηλούς, μεσαίους και υψηλούς.
  • Ας υποθέσουμε ότι το επίπεδο σημασίας είναι 0,05. Εδώ, τα H0 και H1 υποδηλώνουν την ανεξαρτησία και την εξάρτηση της ποιότητας των υπηρεσιών από τους μισθούς των τραπεζών αναμονής.
  • H 0 - η ποιότητα των υπηρεσιών δεν εξαρτάται από τους μισθούς των ατόμων που περιμένουν τα τραπέζια.
  • H 1 - η ποιότητα των υπηρεσιών εξαρτάται από τους μισθούς των ατόμων που περιμένουν τα τραπέζια.
  • Τα ευρήματά της φαίνονται στον παρακάτω πίνακα:

Σε αυτό, έχουμε 9 σημεία δεδομένων που έχουμε 3 ομάδες, καθεμία από τις οποίες έλαβε ένα διαφορετικό μήνυμα σχετικά με τον μισθό, και το αποτέλεσμα δίνεται στα παρακάτω.

Τώρα θα μετρήσουμε το άθροισμα όλων των σειρών και στηλών. Θα το κάνουμε με τη βοήθεια του τύπου, δηλαδή, SUM. To Total the Excellent στη συνολική στήλη, έχουμε γράψει = SUM (B4: D4) και μετά πατήστε το πλήκτρο enter.

Αυτό θα μας δώσει 26 . Θα κάνουμε το ίδιο με όλες τις σειρές και τις στήλες.

Για τον υπολογισμό του βαθμού ελευθερίας (DF), χρησιμοποιούμε (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Υπάρχουν 3 κατηγορίες υπηρεσιών και 3 κατηγορίες μισθών.
  • Έχουμε 27 ερωτηθέντες με μεσαίο μισθό (κάτω σειρά, μεσαία)
  • Έχουμε 51 ερωτηθέντες με καλή υπηρεσία (τελευταία στήλη, μέση)

Τώρα πρέπει να υπολογίσουμε τις αναμενόμενες συχνότητες: -

Οι αναμενόμενες συχνότητες μπορούν να υπολογιστούν χρησιμοποιώντας έναν τύπο: -

  • Για να υπολογίσουμε το άριστο, θα χρησιμοποιήσουμε τον πολλαπλασιασμό του συνόλου του χαμηλού με το σύνολο του άριστου δια του Ν

Ας υποθέσουμε ότι πρέπει να υπολογίσουμε για την 1η σειρά και την 1η στήλη (= B7 * E4 / B9 ) . Αυτό θα δώσει τον αναμενόμενο αριθμό πελατών που έχουν ψηφίσει Εξαιρετική εξυπηρέτηση για τους μισθούς των ατόμων που περιμένουν χαμηλά, δηλαδή 8,32 .

  • E 11 = - (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

Ομοίως, για όλους, πρέπει να κάνουμε το ίδιο και ο τύπος εφαρμόζεται στο παρακάτω διάγραμμα.

Παίρνουμε τον πίνακα Αναμενόμενης συχνότητας όπως δίνεται παρακάτω: -

Σημείωση: - Ας υποθέσουμε ότι το επίπεδο σημασίας είναι 0,05. Εδώ, οι H0 και H1 υποδηλώνουν την ανεξαρτησία και την εξάρτηση της ποιότητας των υπηρεσιών από τους μισθούς των τραπεζών αναμονής.

Μετά τον υπολογισμό της αναμενόμενης συχνότητας, θα υπολογίσουμε τα σημεία δεδομένων του τετραγώνου chi χρησιμοποιώντας έναν τύπο.

Chi-Square Points = (Παρατηρημένα-Αναμενόμενα) 2 / Αναμενόμενα

Για να υπολογίσουμε το πρώτο σημείο, γράφουμε = (B4-B14) 2 / B14.

Θα αντιγράψουμε και θα επικολλήσουμε τον τύπο σε άλλα κελιά για να συμπληρώσουμε αυτόματα την τιμή.

Μετά από αυτό, θα υπολογίσουμε την τιμή chi (Υπολογισμένη τιμή) προσθέτοντας όλες τις τιμές που δίνονται πάνω από τον πίνακα.

Έχουμε την τιμή Chi ως 18.65823 .

Για να υπολογίσουμε την κρίσιμη τιμή για αυτό, χρησιμοποιούμε έναν πίνακα κρίσιμης τιμής chi-square του οποίου μπορούμε να χρησιμοποιήσουμε τον παρακάτω τύπο.

Αυτός ο τύπος περιέχει 2 παραμέτρους CHISQ.INV.RT (πιθανότητα, βαθμός ελευθερίας).

Η πιθανότητα είναι 0,05 και είναι μια σημαντική τιμή που θα μας βοηθήσει να προσδιορίσουμε αν θα αποδεχθούμε την μηδενική υπόθεση (H 0 ) ή όχι.

Η κρίσιμη τιμή του chi-square είναι 9.487729037.

Τώρα θα βρούμε την τιμή του τετραγώνου chi ή (τιμή P) = CHITEST (πραγματικό εύρος, αναμενόμενο εύρος)

Εύρος από = CHITEST (B4: D6, B14: D16) .

Όπως έχουμε δει, η τιμή του chi-test ή της τιμής P είναι = 0,00091723.

Έχουμε υπολογίσει όλες τις τιμές. Οι τιμές chi-square (Υπολογισμένη τιμή) είναι σημαντικές μόνο όταν η τιμή τους είναι η ίδια ή μεγαλύτερη από την κρίσιμη τιμή 9,48, δηλαδή, η κρίσιμη τιμή (τιμή σε πίνακα ) πρέπει να είναι υψηλότερη από την τιμή 18.65 για να αποδεχτεί την Null Hypothesis (H 0 ) .

Αλλά εδώ Υπολογισμένη τιμή > Πίνακας τιμή

X 2 (Υπολογιζόμενο)> X 2 (Πίνακας)

18,65> 9,48

Σε αυτήν την περίπτωση, θα απορρίψουμε την μηδενική υπόθεση (H 0 ) και η εναλλακτική (H 1 ) θα γίνει αποδεκτή.

  • Μπορούμε επίσης να χρησιμοποιήσουμε το P-Value για να προβλέψουμε το ίδιο, δηλαδή, αν P-value <= α (σημαντική τιμή 0,05), η μηδενική υπόθεση θα απορριφθεί.
  • Εάν η τιμή P> α , μην απορρίψετε την μηδενική υπόθεση .

Εδώ τιμή P (0,0009172) < α (0,05), απόρριψη H 0 , αποδοχή H 1

Από το παραπάνω παράδειγμα, συμπεραίνουμε ότι η ποιότητα των υπηρεσιών εξαρτάται από τους μισθούς των ατόμων που περιμένουν.

Πράγματα που πρέπει να θυμάστε

  • Θεωρεί το τετράγωνο μιας τυπικής κανονικής διακύμανσης.
  • Αξιολογεί εάν οι συχνότητες που παρατηρούνται σε διαφορετικές κατηγορίες διαφέρουν σημαντικά από τις συχνότητες που αναμένονται βάσει ενός καθορισμένου συνόλου υποθέσεων.
  • Καθορίζει πόσο καλά μια υποτιθέμενη διανομή ταιριάζει στα δεδομένα.
  • Χρησιμοποιεί πίνακες έκτακτης ανάγκης (σε έρευνες αγοράς, αυτοί οι πίνακες ονομάζονται cross-tabs).
  • Υποστηρίζει μετρήσεις ονομαστικού επιπέδου.

ενδιαφέροντα άρθρα...