Εμπειρικός κανόνας - Ορισμός, τύπος, Πώς να χρησιμοποιήσετε στη Στατιστική;

Ποιος είναι ο εμπειρικός κανόνας στις στατιστικές;

Ο Εμπειρικός Κανόνας στη Στατιστική αναφέρει ότι σχεδόν όλες (95%) των παρατηρήσεων σε μια κανονική κατανομή βρίσκονται εντός 3 Τυπικών αποκλίσεων από το Μέσο. Αυτός είναι ένας πολύ σημαντικός κανόνας και βοηθά στην πρόβλεψη.

Τύπος

Ο τύπος δείχνει το προβλεπόμενο ποσοστό παρατηρήσεων που θα βρίσκονται σε κάθε τυπική απόκλιση από το μέσο όρο.

Ο κανόνας λέει ότι:

  • 68% των παρατηρήσεων θα βρίσκονται εντός της +/- 1 Τυπικής Απόκλισης από το μέσο όρο
  • Το 95% των παρατηρήσεων θα βρίσκεται εντός των +/- 2 τυπικών αποκλίσεων από το μέσο όρο
  • Το 7% των παρατηρήσεων θα βρίσκεται εντός των +/- 3 Τυπικών αποκλίσεων από το μέσο όρο

Πώς να χρησιμοποιήσετε;

Αυτό χρησιμοποιείται στην τάση πρόβλεψης ενός συνόλου δεδομένων. Όταν το σύνολο δεδομένων είναι εκτεταμένο και είναι δύσκολο να μελετηθεί ολόκληρος ο πληθυσμός, τότε ο Εμπειρικός Κανόνας μπορεί να εφαρμοστεί στο δείγμα για να πάρει μια εκτίμηση για το πώς θα αντιδράσουν τα δεδομένα του πληθυσμού εάν σας ζητηθεί να βρείτε τον μέσο μισθό όλων οι λογιστές στις ΗΠΑ. Τότε αυτό είναι ένα δύσκολο έργο να εκτελεστεί καθώς ο πληθυσμός είναι τεράστιος. Έτσι, σε αυτήν την περίπτωση, μπορείτε να επιλέξετε, ας πούμε, 90 παρατηρήσεις τυχαία από ολόκληρο τον πληθυσμό.

Τώρα θα έχετε 90 μισθούς. Πρέπει να βρείτε τη Μέση και Τυπική Απόκλιση των παρατηρήσεων. Εάν η παρατήρηση ακολουθεί μια κανονική κατανομή, τότε αυτό μπορεί να εφαρμοστεί και μπορεί να γίνει εκτίμηση του μισθού όλων των λογιστών στις ΗΠΑ.

Ας πούμε ότι ο μέσος μισθός του δείγματος είναι 90.000 $. Και η τυπική απόκλιση είναι 5.000 $. Έτσι, από ολόκληρο τον πληθυσμό, το 68% των λογιστών λαμβάνει μισθό που κυμαίνεται μεταξύ +/- 1 Τυπικές αποκλίσεις από το μέσο. Καθώς το μέσο είναι 90.000 $ και η τυπική απόκλιση είναι 5.000 $. Έτσι, το 68% όλων των λογιστών στις ΗΠΑ πληρώνεται στο εύρος των 90.000 $ +/- (1 * 5.000 $). Αυτό είναι από 85.000 έως 95.000 $

Εάν διαδώσουμε λίγο περισσότερο, τότε το 95% όλων των λογιστών στις ΗΠΑ πληρώνεται στο εύρος των τυπικών αποκλίσεων μέσου +/- 2. 90.000 $ +/- (2 * 5000). Έτσι, το εύρος είναι 80.000 έως 100.000 $.

Σε ένα ευρύτερο φάσμα, το 99,7% όλων των λογιστών αντλούν μισθούς που κυμαίνονται από μέση +/- 3 τυπική απόκλιση Αυτό είναι 90.000 +/- (3 * 5000). Το εύρος είναι 75.000 έως 105.000 $

Μπορείτε να δείτε ξεκάθαρα ότι χωρίς να μελετήσετε ολόκληρο τον πληθυσμό, θα μπορούσε να γίνει εκτίμηση σχετικά με τον πληθυσμό. Εάν κάποιος σχεδιάζει να εργαστεί ως λογιστής στις ΗΠΑ, τότε μπορεί εύκολα να αναμένει ότι ο μισθός του θα κυμαίνεται από 75.000 έως 105.000 $

Αυτό το είδος εκτίμησης βοηθά στη διευκόλυνση της εργασίας και στην πραγματοποίηση προβλέψεων σχετικά με το μέλλον.

Παραδείγματα εμπειρικών κανόνων

Ο κ. X προσπαθεί να βρει τον μέσο αριθμό ετών που ένα άτομο επιβιώνει μετά τη συνταξιοδότησή του, θεωρώντας ότι η ηλικία συνταξιοδότησης είναι 60. Εάν τα Μέσα έτη επιβίωσης των 50 τυχαίων παρατηρήσεων είναι 20 έτη και το SD είναι 3, τότε ανακαλύψτε την πιθανότητα ότι ένα το άτομο θα λάβει σύνταξη για περισσότερα από 23 χρόνια

Λύση

Ο Εμπειρικός Κανόνας δηλώνει ότι το 68% των παρατηρήσεων θα βρίσκεται σε 1 Τυπική Απόκλιση από το Μέσο. Εδώ ο μέσος όρος των παρατηρήσεων είναι 20.

Το 68% των παρατηρήσεων θα βρίσκεται εντός 20 +/- 1 (Τυπική Απόκλιση), που είναι 20 +/- 3. Επομένως, το εύρος είναι 17 έως 23.

Υπάρχει πιθανότητα 68% ότι τα ελάχιστα έτη επιβίωσης ενός ατόμου μετά τη συνταξιοδότησή τους κυμαίνονται μεταξύ 17 και 23. Τώρα το ποσοστό που βρίσκεται εκτός αυτού του εύρους είναι (100 - 68) = 32%. Το 32 κατανέμεται εξίσου και στις δύο πλευρές, πράγμα που σημαίνει 16% πιθανότητα τα ελάχιστα έτη να είναι κάτω από 17 και 16% πιθανότητα τα ελάχιστα έτη να είναι μεγαλύτερα από 23.

Έτσι, η πιθανότητα ότι το άτομο θα αντλήσει περισσότερα από 23 χρόνια σύνταξης είναι 16%.

Εμπειρικός κανόνας εναντίον του Θεώρημα του Τσέμπισεφ

Ο Εμπειρικός Κανόνας εφαρμόζεται σε σύνολα δεδομένων που ακολουθούν μια κανονική κατανομή που σημαίνει σχήμα καμπάνας. Σε μια κανονική κατανομή, και οι δύο πλευρές της κατανομής έχουν 50% πιθανότητα η καθεμία.

Εάν το σύνολο δεδομένων δεν διανέμεται κανονικά, τότε υπάρχει μια άλλη προσέγγιση ή Κανόνας που ισχύει για όλους τους τύπους συνόλων δεδομένων, που είναι το Θεώρημα του Chebyshev. Λέει τρία πράγματα:

  • Τουλάχιστον 3/4 ου όλων των παρατηρήσεων που θα βρίσκονται μέσα σε 2Standard αποκλίσεων από τη μέση. Είναι μια ισχυρή προσέγγιση. Αυτό σημαίνει ότι εάν υπάρχουν 100 παρατηρήσεις, τότε 3/4 ου των παρατηρήσεων που είναι 75 παρατηρήσεις θα βρίσκεται εντός +/- 2 τυπικές αποκλίσεις από την μέση τιμή.
  • Τουλάχιστον 8/9 ου όλων των παρατηρήσεων θα βρίσκεται εντός 3Standard αποκλίσεων από τη μέση.
  • Τουλάχιστον 1 - 1 / k 2 όλων των παρατηρήσεων βρίσκονται σε Κ τυπικές αποκλίσεις από το μέσο. Εδώ το Κ αναφέρεται ως οποιοσδήποτε ακέραιος αριθμός.

Πότε να χρησιμοποιήσετε;

Τα δεδομένα είναι σαν το χρυσό στον σύγχρονο κόσμο. Υπάρχουν τεράστια δεδομένα που προέρχονται από διαφορετικές πηγές και χρησιμοποιούνται για διαφορετικές προσεγγίσεις ή προβλέψεις. Εάν ένα σύνολο δεδομένων ακολουθεί μια κανονική κατανομή, δείχνει μια καμπύλη σε σχήμα καμπάνας. τότε, μπορεί να χρησιμοποιηθεί ο Εμπειρικός Κανόνας. Εφαρμόζεται σε παρατηρήσεις για να δημιουργήσει μια προσέγγιση για τον πληθυσμό.

Μόλις διαπιστωθεί ότι οι παρατηρήσεις δείχνουν μια δομή Κανονικής Κατανομής, τότε ακολουθείται ο Εμπειρικός Κανόνας για να βρει πολλές πιθανότητες των παρατηρήσεων. Ο Κανόνας είναι εξαιρετικά χρήσιμος για πολλές στατιστικές προβλέψεις.

συμπέρασμα

Ο Εμπειρικός Κανόνας είναι μια στατιστική έννοια που βοηθά στην απεικόνιση της πιθανότητας των παρατηρήσεων και είναι πολύ χρήσιμη όταν βρίσκουμε μια προσέγγιση ενός τεράστιου πληθυσμού. Πρέπει πάντα να σημειωθεί ότι αυτές είναι προσεγγίσεις. Υπάρχουν πάντα πιθανότητες outliers που δεν εμπίπτουν στη διανομή. Επομένως, τα ευρήματα δεν είναι ακριβή και πρέπει να λαμβάνονται προληπτικά μέτρα όταν ενεργείτε σύμφωνα με την πρόβλεψη.

ενδιαφέροντα άρθρα...