Παλινδρόμηση (Σημασία, Τύποι) - Τι είναι η ανάλυση παλινδρόμησης;

Πίνακας περιεχομένων

Τι είναι η παλινδρόμηση;

Η ανάλυση παλινδρόμησης είναι μια στατιστική μέτρηση που χρησιμοποιείται στη χρηματοδότηση, την επένδυση κ.λπ., η οποία στοχεύει στη δημιουργία σχέσης μεταξύ μιας εξαρτημένης μεταβλητής και άλλων σειρών ανεξάρτητων μεταβλητών και η πρωταρχική εστίαση είναι ο καθορισμός της ισχύος της παραπάνω σχέσης.

Επεξηγήσεις

  • Για να εξηγήσουμε την ανάλυση παλινδρόμησης σε έναν απλό, ας υποθέσουμε ότι ένας επικεφαλής πωλήσεων μιας εταιρείας προσπαθεί σκληρά να προβλέψει τις πωλήσεις του επόμενου μήνα. Υπάρχουν πολλοί παράγοντες που επηρεάζουν τις πωλήσεις του προϊόντος, ξεκινώντας από τον καιρό έως τη νέα στρατηγική, το φεστιβάλ του ανταγωνιστή και την αλλαγή στον τρόπο ζωής των καταναλωτών.
  • Αυτή είναι μια μέθοδος ευθυγράμμισης από τους διάφορους παράγοντες που επηρεάζουν την πώληση, οι οποίοι είναι αυτοί που έχουν το μεγαλύτερο αντίκτυπο. Μπορεί να βοηθήσει στην απάντηση πολλών ερωτήσεων, όπως ποιοι είναι οι πιο σημαντικοί παράγοντες, ποιοι παράγοντες είναι λιγότερο σημαντικοί, ποια είναι η σχέση μεταξύ αυτών των παραγόντων, και το πιο σημαντικό, ποια είναι η εγγύηση αυτών των παραγόντων.
  • Αυτοί οι παράγοντες ονομάζονται μεταβλητές. Ο κύριος παράγοντας που προσπαθούμε να προβλέψουμε ονομάζεται εξαρτημένη μεταβλητή και οι άλλοι παράγοντες που επηρεάζουν την εξαρτημένη μεταβλητή ονομάζονται ανεξάρτητες μεταβλητές.

Τύπος

Η απλή ανάλυση γραμμικής παλινδρόμησης στο excel μπορεί να εκφραστεί ως ο παρακάτω τύπος και μετρά τη σχέση μεταξύ μιας εξαρτημένης μεταβλητής και μιας ανεξάρτητης μεταβλητής.

Y = a + bX + ϵ

Εδώ:

  • Y - Εξαρτώμενη μεταβλητή
  • X - Ανεξάρτητη (επεξηγηματική) μεταβλητή
  • α - Παρεμβολή
  • β - Κλίση
  • ϵ - Υπόλοιπο (σφάλμα)

Πώς να ερμηνεύσετε την ανάλυση παλινδρόμησης;

Αυτό μπορεί να ερμηνευθεί υποθέτοντας ένα απλό σενάριο. Εδώ παίρνουμε τη σχέση μεταξύ των τιμών της συλλογής αντίκες για δημοπρασία και της διάρκειας της ηλικίας της. Όσο μεγαλώνει μια αντίκα, τόσο μεγαλύτερη είναι η τιμή. Υποθέτοντας ότι έχουμε ορίσει δεδομένα για τα τελευταία 50 στοιχεία που είχαν δημοπρατηθεί, μπορούμε να προβλέψουμε ποιες θα είναι οι μελλοντικές τιμές δημοπρασίας με βάση την ηλικία του αντικειμένου. Χρησιμοποιώντας αυτά τα δεδομένα, μπορούμε να δημιουργήσουμε μια εξίσωση παλινδρόμησης.

Ο τύπος παλινδρόμησης που μπορεί να δημιουργήσει μια σχέση μεταξύ ηλικίας και τιμής έχει ως εξής:

y = β0 + β1 x + σφάλμα
  • Εδώ ο εξαρτώμενος συντελεστής είναι Υ. Το Υ αντιπροσωπεύει την τιμή κάθε αντικειμένου που θα πλειστηριαστεί, ενώ ο ανεξάρτητος παράγοντας είναι ο Χ, ο οποίος καθορίζει την ηλικία.
  • Οι παράμετροι β0 και β1 είναι παράμετροι που δεν είναι γνωστές και θα εκτιμηθούν από την εξίσωση.
  • Το β0 είναι μια σταθερά που χρησιμοποιείται για τον καθορισμό της γραμμικής γραμμής τάσεων που παρεμποδίζει τον άξονα Υ.
  • Το β1 είναι μια σταθερά που δείχνει το μέγεθος της μεταβολής στην τιμή της εξαρτημένης μεταβλητής ως σχετική συνάρτηση της αλλαγής που υπονοείται στις ανεξάρτητες μεταβλητές.
  • Αυτό ονομάζεται βασικά η κλίση της εξίσωσης. Όταν η κλίση είναι μια επένδυση, αυτό σημαίνει ότι υπάρχει μια αναλογική σχέση μεταξύ ηλικίας και τιμής και όπου η κλίση είναι αντίστροφη, σημαίνει ότι η σχέση είναι έμμεσα ανάλογη.
  • Το σφάλμα μπορεί να οριστεί ως ο θόρυβος ή η διακύμανση της μεταβλητής στόχου και είναι τυχαίας φύσης.

Πραγματικά παραδείγματα ανάλυσης παλινδρόμησης

Ας υποθέσουμε ότι πρέπει να δημιουργήσουμε μια σχέση μεταξύ των πωλήσεων που πραγματοποιήθηκαν και του ποσού που δαπανήθηκε για τη διαφήμιση που σχετίζεται με ένα προϊόν.

Γενικά μπορούμε να παρατηρήσουμε μια θετική σχέση μεταξύ της ποσότητας πωλήσεων και του ποσού που δαπανάται για τη διαφήμιση. Η απλή εξίσωση γραμμικής παλινδρόμησης, έχουμε:

Y = a + bX

Ας υποθέσουμε ότι έχουμε την τιμή ως

Υ = 500 + 30Χ

Ερμηνεία αποτελεσμάτων:

Η προβλεπόμενη κλίση των 30 μας βοηθά να καταλήξουμε στο συμπέρασμα ότι οι μέσες πωλήσεις αυξάνουν 30 $ ετησίως καθώς αυξάνεται η δαπάνη για διαφήμιση.

Τύποι ανάλυσης παλινδρόμησης

# 1 - Γραμμικό

Αυτό μπορεί να εκφραστεί ως ο παρακάτω τύπος και μετρά τη σχέση μεταξύ μιας εξαρτημένης μεταβλητής και μιας ανεξάρτητης μεταβλητής.

# 2 - Πολυωνύμιο

Σε αυτήν τη μέθοδο, η ανάλυση χρησιμοποιείται για τη μέτρηση της σχέσης μεταξύ μεμονωμένων εξαρτημένων παραγόντων και πολλαπλών ανεξάρτητων μεταβλητών.

# 3 - Λογιστική

Εδώ ο εξαρτώμενος παράγοντας ή μεταβλητή είναι δυαδικής φύσης. Οι ανεξάρτητες μεταβλητές μπορεί να είναι συνεχείς ή δυαδικές. Στην πολυεθνική λογιστική παλινδρόμηση, μπορούμε να έχουμε περισσότερες από δύο κατηγορίες επιλέγοντας την ανεξάρτητη μεταβλητή μας.

# 4 - Ποσότητα

Αυτή είναι μια πρόσθετη έννοια της γραμμικής παλινδρόμησης και χρησιμοποιείται κατά κύριο λόγο όταν υπάρχουν ακραίες τιμές και ασυμμετρία στα δεδομένα.

# 5 - Ελαστικό δίχτυ

Αυτό είναι χρήσιμο όταν κάποιος χειρίζεται πολύ υψηλές συσχετιζόμενες ανεξάρτητες μεταβλητές.

# 6 - Παλινδρόμηση κύριων συστατικών (PCR)

Αυτή είναι μια τεχνική που εφαρμόζεται όταν υπάρχουν πάρα πολλές ανεξάρτητες μεταβλητές ή υπάρχει πολυγραμμικότητα στα δεδομένα

# 7 - Μερικά ελάχιστα τετράγωνα (PLS)

Είναι μια αντίθετη μέθοδος του κύριου συστατικού όπου έχουμε ανεξάρτητες μεταβλητές που συσχετίζονται πολύ. Εφαρμόζεται επίσης όταν υπάρχουν πολλές ανεξάρτητες μεταβλητές.

# 8 - Διάνυσμα υποστήριξης

Αυτό μπορεί να προσφέρει μια λύση σε γραμμικά και μη γραμμικά μοντέλα. Χρησιμοποιεί μη γραμμικές λειτουργίες πυρήνα για να βρει τη βέλτιστη λύση για μη γραμμικά μοντέλα.

# 9 - Κανονικό

Ισχύει για την πρόβλεψη των τιμών κατάταξης. Βασικά, είναι κατάλληλο όταν η εξαρτημένη μεταβλητή είναι κανονικής φύσης

# 10 - Poisson

Αυτό ισχύει όταν η εξαρτημένη μεταβλητή έχει δεδομένα μετρήσεων.

# 11 - Αρνητικό διωνυμικό

Είναι επίσης εφαρμόσιμο για τη διαχείριση δεδομένων καταμέτρησης μόνο ότι η αρνητική διωνυμική παλινδρόμηση δεν προϋποθέτει κατανομή του αριθμού που έχει διακύμανση ίση με τη μέση τιμή του, ενώ η παλινδρόμηση Poisson υποθέτει τη διακύμανση ίση με τη μέση τιμή.

# 12 - Quasi Poisson

Είναι υποκατάστατο της αρνητικής διωνυμικής παλινδρόμησης. Εφαρμόζεται επίσης σε διασκορπισμένα δεδομένα μετρήσεων. Η διακύμανση ενός μοντέλου οιονεί-Poisson είναι μια γραμμική συνάρτηση του μέσου, ενώ η διακύμανση ενός αρνητικού διωνυμικού μοντέλου είναι μια τετραγωνική συνάρτηση του μέσου.

# 13 - Κοξ

Έρχεται περισσότερο στη χρήση για την ανάλυση δεδομένων από ώρα σε εκδήλωση.

Διαφορά μεταξύ παλινδρόμησης και συσχέτισης

  • Η παλινδρόμηση καθιερώνει τη σχέση μεταξύ μιας ανεξάρτητης διακύμανσης και μιας εξαρτημένης μεταβλητής όπου και οι δύο μεταβλητές είναι διαφορετικές, ενώ η συσχέτιση καθορίζει τη σχέση ή την εξάρτηση δύο μεταβλητών όπου δεν υπάρχει διαφορά μεταξύ των δύο μεταβλητών.
  • Ο κύριος στόχος της παλινδρόμησης είναι η δημιουργία μιας γραμμής βέλτιστης προσαρμογής και η εκτίμηση μιας μεταβλητής γίνεται με βάση άλλες, ενώ σε συσχετισμό καταδεικνύεται η γραμμική σχέση μεταξύ δύο μεταβλητών.
  • Σε αυτό, εκτιμούμε το μέγεθος μιας συγκεκριμένης μεταβολής στην αναγνωρισμένη μεταβλητή (X) στην εκτιμώμενη μεταβλητή (Y), ενώ, σε συσχέτιση, ο συντελεστής χρησιμοποιείται για να μετρήσει σε ποιο βαθμό οι δύο μεταβλητές κινούνται μαζί.
  • Είναι μια διαδικασία εκτίμησης του μεγέθους των τυχαίων ανεξάρτητων μεταβλητών με βάση το μέγεθος μιας στατικής εξαρτώμενης μεταβλητής, ενώ η συσχέτιση μας βοηθά να αποφασίσουμε μια συγκεκριμένη τιμή για να εκφράσουμε την αλληλεξάρτηση μεταξύ των δύο μεταβλητών.

συμπέρασμα

  • Η ανάλυση παλινδρόμησης χρησιμοποιεί κυρίως δεδομένα προκειμένου να δημιουργήσει μια σχέση μεταξύ δύο ή περισσότερων μεταβλητών. Εδώ θεωρείται ότι οι σχέσεις που υπήρχαν στο παρελθόν θα αντανακλούν επίσης στο παρόν ή στο μέλλον. Λίγοι το θεωρούν αυτό ως χρονική υστέρηση μεταξύ του παρελθόντος και του παρόντος / του μέλλοντος.
  • Ωστόσο, είναι μια ευρέως χρησιμοποιούμενη τεχνική πρόβλεψης και εκτίμησης. Αν και περιλαμβάνει μαθηματικά, τα οποία πολλοί χρήστες μπορεί να θεωρήσουν δύσκολο, η τεχνική είναι σχετικά εύκολη στη χρήση, ειδικά όταν υπάρχει διαθέσιμο μοντέλο.

ενδιαφέροντα άρθρα...