Τύπος για τον υπολογισμό της συσχέτισης
Η συσχέτιση είναι ένα στατιστικό μέτρο μεταξύ δύο μεταβλητών και ορίζεται ως η αλλαγή της ποσότητας σε μια μεταβλητή που αντιστοιχεί σε αλλαγή σε μια άλλη και υπολογίζεται με άθροισμα του προϊόντος του αθροίσματος της πρώτης μεταβλητής μείον τον μέσο όρο της πρώτης μεταβλητής στο άθροισμα της δεύτερης μεταβλητής μείον ο μέσος όρος της δεύτερης μεταβλητής διαιρούμενος ολόκληρος κάτω από τη ρίζα του προϊόντος του τετραγώνου της πρώτης μεταβλητής μείον τον μέσο όρο της πρώτης μεταβλητής σε άθροισμα του τετραγώνου της δεύτερης μεταβλητής μείον τον μέσο όρο της δεύτερης μεταβλητής.
Η τιμή της συσχέτισης περιορίζεται μεταξύ -1 και +1 και μπορεί να ερμηνευθεί ως εξής:
- -1: Εάν είναι -1, οι μεταβλητές είναι γνωστές ως συσχετισμένες τέλεια αρνητικά. Αυτό σημαίνει ότι εάν μία μεταβλητή κινείται προς μία κατεύθυνση, τότε μια άλλη μετακινείται προς την αντίθετη κατεύθυνση.
- 0: Αυτό σημαίνει ότι η μεταβλητή δεν έχει καμία συσχέτιση.
- +1: Εάν είναι +1, οι μεταβλητές είναι γνωστές ως συσχετίζονται τέλεια θετικά. Και οι δύο μεταβλητές κινούνται προς θετικές κατευθύνσεις.
Εάν έχουμε 2 μεταβλητές x και y τότε ο συντελεστής συσχέτισης μεταξύ 2 μεταβλητών μπορεί να βρεθεί ως:
Συντελεστής συσχέτισης = ∑ (x (i) - μέσος όρος (x)) * (y (i) -mean (y)) / √ (∑ (x (i) -mean (x)) 2 * ∑ (y (i) - σημαίνει (y)) 2 )
Που,
- x (i) = τιμή x στο δείγμα
- Μέσος όρος (x) = μέσος όρος όλων των τιμών του x
- y (i) = τιμή του y στο δείγμα
- Μέσος όρος (y) = μέσος όρος όλων των τιμών του y
Παραδείγματα
Είναι εύκολο να υπολογιστεί η συσχέτιση στο Excel. Η σύνταξη της συνάρτησης που χρησιμοποιείται έχει ως εξής:
Συντελεστής συσχέτισης = CORREL (πίνακας1, πίνακας2)
Παράδειγμα # 1
Ας πάρουμε το ίδιο παράδειγμα που έχουμε λάβει παραπάνω για τον υπολογισμό της συσχέτισης χρησιμοποιώντας το Excel.
Λύση:
Ακολουθούν οι τιμές των x και y:

Ο υπολογισμός έχει ως εξής.

Βασικός τύπος excel = CORREL (πίνακας (x), πίνακας (y))

Συντελεστής = +0,95
Δεδομένου ότι αυτός ο συντελεστής είναι κοντά στο +1, επομένως τα x και y συσχετίζονται πολύ θετικά.
Παράδειγμα # 2
Η συσχέτιση είναι κυρίως χρήσιμη για την ανάλυση της τιμής των μετοχών των εταιρειών και τη δημιουργία ενός χαρτοφυλακίου μετοχών βάσει αυτού.
Ας ανακαλύψουμε τη συσχέτιση της μετοχής της Apple με τον δείκτη Nasdaq με βάση την απόδοση των τελευταίων ενός ετών. Η Apple είναι μια πολυεθνική εταιρεία που εδρεύει στις ΗΠΑ και εξειδικεύεται σε προϊόντα πληροφορικής όπως iPod, iPad, Mac κ.λπ.
Λύση:
Ακολουθεί η μηνιαία απόδοση των αποθεμάτων Apple και Nasdaq για το τελευταίο έτος:

Ας εισάγουμε τώρα τις τιμές -
Συντελεστής συσχέτισης = ∑ (x (i) - μέσος όρος (x)). (Y (i) -mean (y)) / √ ∑ (x (i) -mean (x)) 2 ∑ (y (i) - μέση τιμή (y)) 2

Συσχέτιση μεταξύ Apple και Nasdaq = 0,039 / (√0,0039)

Συντελεστής = 0,62
Δεδομένου ότι η συσχέτιση μεταξύ της Apple και του Nasdaq είναι θετική, ως εκ τούτου η Apple συσχετίζεται θετικά με τη Nasdaq.
Παράδειγμα # 3
Ας δούμε τώρα τη συσχέτιση μεταξύ του δείκτη Walmart και Nasdaq με βάση την τελευταία μετοχή ενός έτους. Η Walmart είναι μια εταιρεία που εδρεύει στις ΗΠΑ και διαθέτει αλυσίδα λιανικών σούπερ μάρκετ.
Λύση:
Παρακάτω είναι η μηνιαία απόδοση μεταξύ Walmart και Nasdaq για τον τελευταίο χρόνο-

Ας εισάγουμε τώρα τις τιμές στον τύπο -
Συντελεστής συσχέτισης = ∑ (x (i) - μέσος όρος (x)). (Y (i) -mean (y)) / √ ∑ (x (i) -mean (x)) 2 ∑ (y (i) - μέση τιμή (y)) 2
Επομένως, ο υπολογισμός έχει ως εξής,

Συσχέτιση μεταξύ Walmart και Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Συντελεστής = 0,12
Μπορούμε να δούμε ότι οι Walmart και Nasdaq συσχετίζονται επίσης θετικά αλλά όχι τόσο πολύ σε σύγκριση με τη συσχέτιση της Apple με τη Nasdaq.
Συνάφεια και χρήση
Ένας συντελεστής συσχέτισης είναι χρήσιμος για τον καθορισμό της γραμμικής σχέσης μεταξύ δύο μεταβλητών. Μετρά τον τρόπο μετακίνησης μιας μεταβλητής σε σύγκριση με την κίνηση μιας άλλης μεταβλητής. Η πρακτική χρήση αυτού του συντελεστή είναι να ανακαλυφθεί η σχέση μεταξύ της μεταβολής των τιμών των μετοχών και της συνολικής κίνησης της αγοράς. Η βάση αυτής της ανάλυσης, ένας αναλυτής μετοχών, θα περιλαμβάνει το ποσοστό των αποθεμάτων για τη δημιουργία ενός βέλτιστου χαρτοφυλακίου με ελάχιστο κίνδυνο. Επίσης, είναι χρήσιμο στην επιστήμη δεδομένων να ανακαλυφθεί η σχέση μεταξύ 2 μεταβλητών.
Επίσης, ο συντελεστής συσχέτισης χρησιμοποιείται πολύ για τη μελέτη της εγκυρότητας των δεδομένων στην ανάλυση των παραγόντων. Χρησιμοποιείται σε μεγάλο βαθμό στην ανάλυση παλινδρόμησης για να προβλέψει τις τιμές των εξαρτημένων μεταβλητών με βάση τη σχέση μεταξύ εξαρτημένων και ανεξάρτητων μεταβλητών. Αυτή η εξίσωση είναι αρκετά χρήσιμη στην ποσοτική ανάλυση για να πάρει τη φύση της σχέσης μεταξύ διαφόρων μεταβλητών. Η βάση αυτής της σχέσης, εάν μια μεταβλητή δεν σχετίζεται με άλλες μεταβλητές, τότε μπορεί να εξαλειφθεί από τη λίστα.