Κανονική κατανομή στη Στατιστική - Ορισμός, Παράδειγμα, Ερμηνεία

Τι είναι η Κανονική Κατανομή στα Στατιστικά;

Η Κανονική Κατανομή είναι μια καμπύλη κατανομής συχνοτήτων σε σχήμα καμπάνας που βοηθά στην περιγραφή όλων των πιθανών τιμών που μπορεί να λάβει μια τυχαία μεταβλητή εντός ενός δεδομένου εύρους με το μεγαλύτερο μέρος της περιοχής κατανομής να βρίσκεται στη μέση και λίγα είναι στην ουρά, στα άκρα. Αυτή η κατανομή έχει δύο βασικές παραμέτρους: τη μέση τιμή (μ) και την τυπική απόκλιση (σ) που παίζει βασικό ρόλο στον υπολογισμό της απόδοσης περιουσιακών στοιχείων και στη στρατηγική διαχείρισης κινδύνου.

Πώς να ερμηνεύσετε την κανονική κατανομή

Το παραπάνω σχήμα δείχνει ότι η στατιστική κανονική κατανομή είναι καμπύλη σε σχήμα καμπάνας. Το εύρος των πιθανών αποτελεσμάτων αυτής της διανομής είναι ολόκληροι οι πραγματικοί αριθμοί που κυμαίνονται μεταξύ -∞ έως + ∞. Οι ουρές της καμπύλης καμπάνας εκτείνονται και στις δύο πλευρές του γραφήματος (+/-) χωρίς όρια.

  • Περίπου το 68% του συνόλου της παρατήρησης εμπίπτει στο +/- μία τυπική απόκλιση (σ)
  • Περίπου το 95% του συνόλου της παρατήρησης εμπίπτει σε +/- δύο τυπικές αποκλίσεις (σ)
  • Περίπου το 99% του συνόλου της παρατήρησης εμπίπτει σε +/- τρεις τυπικές αποκλίσεις (σ)

Έχει ασυμμετρία μηδέν (συμμετρία κατανομής). Εάν η κατανομή δεδομένων είναι ασύμμετρη, τότε η κατανομή είναι άνιση αν το σύνολο δεδομένων έχει κλίση μεγαλύτερη από μηδέν ή θετική ασυμμετρία. Στη συνέχεια, η δεξιά ουρά της κατανομής είναι πιο παρατεταμένη από την αριστερή, και για αρνητική κλίση (λιγότερο από το μηδέν) η αριστερή ουρά θα είναι μεγαλύτερη από τη δεξιά ουρά.

Έχει μια κούρτιση 3 (μετρά την αιχμή μιας κατανομής), η οποία δείχνει ότι η κατανομή δεν είναι ούτε πολύ αιχμηρή ούτε πολύ λεπτή ουρά. Εάν η kurtosis είναι μεγαλύτερη από τρεις από την κατανομή είναι πιο έντονη με παχύτερες ουρές και αν η kurtosis είναι μικρότερη από τρεις, τότε έχει λεπτές ουρές και το σημείο αιχμής είναι χαμηλότερο από την κανονική κατανομή.

Χαρακτηριστικά

  • Αντιπροσωπεύουν μια οικογένεια διανομής όπου η μέση τιμή και η απόκλιση καθορίζουν το σχήμα της κατανομής.
  • Ο μέσος όρος, ο διάμεσος και ο τρόπος αυτής της κατανομής είναι όλοι ίσοι.
  • Οι μισές από τις τιμές βρίσκονται στα αριστερά του κέντρου και οι άλλες μισές στα δεξιά.
  • Η συνολική τιμή κάτω από την τυπική καμπύλη θα είναι πάντα μία.
  • Πιθανότατα, η κατανομή είναι στο κέντρο και λιγότερες τιμές βρίσκονται στο πίσω μέρος.

Μετασχηματισμός (Z)

Η συνάρτηση πυκνότητας πιθανότητας (PDF) μιας τυχαίας μεταβλητής (X) μετά την κατανομή δίνεται από:

όπου -∞ <x <∞; -∞ <μ 0

Που,

  • F (x) = Συνάρτηση κανονικής πιθανότητας
  • x = Τυχαία μεταβλητή
  • μ = Μέσος όρος κατανομής
  • σ = Τυπική απόκλιση της κατανομής
  • π = 3.14159
  • e = 2.71828

Τύπος μετασχηματισμού

Που,

  • X = Τυχαία μεταβλητή

Παραδείγματα κανονικής κατανομής στα στατιστικά

Ας συζητήσουμε τα ακόλουθα παραδείγματα.

Παράδειγμα # 1

Ας υποθέσουμε ότι μια εταιρεία έχει 10000 υπαλλήλους και πολλαπλές δομές μισθών σύμφωνα με τον ρόλο της εργασίας στον οποίο εργάζεται ο εργαζόμενος. Οι μισθοί κατανέμονται γενικά με τον μέσο πληθυσμό των μ = 60.000 $ και την τυπική απόκλιση πληθυσμού σ = 15000 $. Ποια θα είναι η πιθανότητα ότι ο τυχαία επιλεγμένος υπάλληλος έχει μισθό κάτω των 45000 $ ετησίως.

Λύση

Όπως φαίνεται στο παραπάνω σχήμα, για να απαντήσουμε σε αυτήν την ερώτηση, πρέπει να ανακαλύψουμε την περιοχή κάτω από την κανονική καμπύλη από 45 έως την αριστερή ουρά. Επίσης, πρέπει να χρησιμοποιήσουμε την τιμή Z-table για να λάβουμε τη σωστή απάντηση.

Πρώτον, πρέπει να μετατρέψουμε τη δεδομένη μέση και τυπική απόκλιση σε τυπική κανονική κατανομή με μέση τιμή (μ) = 0 και τυπική απόκλιση (σ) = 1 χρησιμοποιώντας τον τύπο μετασχηματισμού.

Μετά τη μετατροπή, πρέπει να αναζητήσουμε τον πίνακα Z για να μάθουμε την αντίστοιχη τιμή, η οποία θα μας δώσει τη σωστή απάντηση.

Δεδομένος,

  • Μέσος όρος (μ) = 60.000 $
  • Τυπική απόκλιση (σ) = 15000 $
  • Τυχαία μεταβλητή (x) = 45000 $

Μετασχηματισμός (z) = (45000 - 60000/15000)

Μετασχηματισμός (z) = -1

Τώρα η τιμή που είναι ισοδύναμη με -1 στον πίνακα Z είναι 0,1587, η οποία αντιπροσωπεύει την περιοχή κάτω από την καμπύλη από το 45 έως το δρόμο προς τα αριστερά. Δείχνει ότι όταν επιλέγουμε τυχαία έναν υπάλληλο, η πιθανότητα να κερδίσετε λιγότερα από 45000 $ ετησίως είναι 15,87%.

Παράδειγμα # 2

Τώρα διατηρώντας το ίδιο σενάριο όπως παραπάνω, μάθετε την πιθανότητα ότι ο τυχαία επιλεγμένος υπάλληλος κερδίζει περισσότερα από 80.000 $ ετησίως χρησιμοποιώντας την κανονική διανομή.

Λύση

Έτσι, σε αυτήν την ερώτηση, πρέπει να ανακαλύψουμε τη σκιασμένη περιοχή από 80 έως δεξιά ουρά χρησιμοποιώντας τον ίδιο τύπο.

Δεδομένος,

  • Μέσος όρος (μ) = 60.000 $
  • Τυπική απόκλιση (σ) = 15000 $
  • Τυχαία μεταβλητή (X) = 80.000 $

Μετασχηματισμός (z) = (80000 - 60000/15000)

Μετασχηματισμός (z) = 1,33

Σύμφωνα με τον πίνακα Z, η ισοδύναμη τιμή του 1,33 είναι 0,9082 ή 90,82%, πράγμα που δείχνει ότι η πιθανότητα τυχαίας επιλογής υπαλλήλων που κερδίζουν λιγότερα από 80.000 $ ετησίως είναι 90,82%.

Αλλά σύμφωνα με την ερώτηση, πρέπει να προσδιορίσουμε την πιθανότητα των τυχαίων υπαλλήλων να κερδίζουν περισσότερα από 80.000 $ ετησίως, οπότε πρέπει να αφαιρέσουμε την τιμή από 100.

  • Τυχαία μεταβλητή (X) = 100% - 90,82%
  • Τυχαία μεταβλητή (X) = 9,18%

Έτσι, η πιθανότητα οι εργαζόμενοι να κερδίζουν περισσότερα από 80.000 $ ετησίως είναι 9,18%.

Χρήσεις

  • Το τεχνικό διάγραμμα του χρηματιστηρίου είναι συχνά καμπύλη καμπής, επιτρέποντας στους αναλυτές και τους επενδυτές να κάνουν στατιστικά συμπεράσματα σχετικά με την αναμενόμενη απόδοση και τον κίνδυνο των μετοχών.
  • Χρησιμοποιείται στον πραγματικό κόσμο, για να προσδιορίσει τον πιο πιθανό καλύτερο χρόνο που χρειάζονται οι εταιρείες πίτσας για την παράδοση πίτσας και πολλές άλλες πραγματικές εφαρμογές.
  • Χρησιμοποιείται για τη σύγκριση των υψών ενός δεδομένου συνόλου πληθυσμού στο οποίο οι περισσότεροι άνθρωποι θα έχουν μέσο μέγεθος με πολύ λίγα άτομα που έχουν πάνω από το μέσο όρο ή κάτω από το μέσο ύψος.
  • Χρησιμοποιούνται για τον προσδιορισμό της μέσης ακαδημαϊκής απόδοσης των μαθητών, κάτι που βοηθά στη σύγκριση της κατάταξης των μαθητών.

συμπέρασμα

Η κανονική κατανομή βρίσκει εφαρμογές στην επιστήμη δεδομένων και στην ανάλυση δεδομένων. Οι προηγμένες τεχνολογίες όπως η Τεχνητή Νοημοσύνη και η μηχανική μάθηση που χρησιμοποιούνται μαζί με αυτήν τη διανομή μπορούν να προσφέρουν καλύτερη ποιότητα δεδομένων, η οποία θα βοηθήσει άτομα και εταιρείες στην αποτελεσματική λήψη αποφάσεων.

ενδιαφέροντα άρθρα...