Η αποσύνθεση μονής τιμής (SVD) είναι ένα από τα πιο ευρέως χρησιμοποιούμενα και χρήσιμα χαρακτηριστικά για όλες τις χρήσεις στην αριθμητική γραμμική άλγεβρα για την απόκτηση δεδομένων, ενώ η ανάλυση κύριου συστατικού (PCA) είναι μια καθιερωμένη μέθοδος που έχει εισαγάγει πολλές θεωρίες σχετικά με τη στατιστική.
Συγκεκριμένα, η PCA μας παρέχει ένα ιεραρχικό σύστημα συντεταγμένων που βασίζεται σε δεδομένα.
Βασικές τακτικές
- Το SVD είναι μια τεχνική παραγοντοποίησης μήτρας που εφαρμόζεται σε οποιονδήποτε πίνακα, ενώ το PCA είναι ένας γραμμικός μετασχηματισμός ειδικά για πίνακες συνδιακύμανσης.
- Το PCA χρησιμοποιείται για συμπίεση δεδομένων και εξαγωγή χαρακτηριστικών, ενώ το SVD έχει διάφορες εφαρμογές στην επεξεργασία σήματος, την εξόρυξη δεδομένων και την ανάκτηση πληροφοριών.
- Το SVD δεν απαιτεί κεντρικά δεδομένα, ενώ το PCA λειτουργεί καλύτερα με κεντρικά και κανονικοποιημένα δεδομένα.
Αποσύνθεση μοναδικής τιμής (SVD) έναντι ανάλυσης κύριου στοιχείου (PCA)
Η Singular Value Decomposition (SVD) είναι μια μέθοδος παραγοντοποίησης στη γραμμική άλγεβρα που μπορεί να αποσυνθέσει οποιοδήποτε πραγματικό ή σύνθετο πίνακα. Η ανάλυση κύριας συνιστώσας (PCA) είναι μια στατιστική διαδικασία που χρησιμοποιεί SVD ή αποσύνθεση ιδιόγονου στον πίνακα συνδιακύμανσης ή συσχέτισης για τον προσδιορισμό των κύριων συνιστωσών.
Η αποσύνθεση μοναδικής τιμής (SVD) είναι το πιο ευρέως χρησιμοποιούμενο χαρακτηριστικό στην αριθμητική γραμμική άλγεβρα. Βοηθά στη μείωση των δεδομένων στα βασικά χαρακτηριστικά που απαιτούνται για ανάλυση, κατανόηση και περιγραφή.
Το svd είναι ένα από τα πρώτα στοιχεία στην πλειονότητα της προεπεξεργασίας δεδομένων και μάθηση μηχανής ειδικότερα αλγόριθμους για τη μείωση δεδομένων. Το SVD είναι μια γενίκευση μετασχηματισμού Fourier που βασίζεται σε δεδομένα.
Η ανάλυση του κύριου συστατικού (PCA) είναι πλέον ένα στατιστικό εργαλείο που έχει γεννήσει πολλές ιδέες. Αυτό θα μας επιτρέψει να χρησιμοποιήσουμε ένα ιεραρχικό σύνολο σημείων για να εκφράσουμε στατιστικές αλλαγές.
Το PCA είναι μια τεχνική στατιστικής/μηχανικής νοημοσύνης που χρησιμοποιείται για τον προσδιορισμό των κύριων προτύπων δεδομένων που μεγιστοποιούν τη συνολική διακύμανση. Έτσι η μέγιστη διακύμανση συλλαμβάνεται από ένα σύστημα συντεταγμένων ανάλογα με τις κατευθύνσεις των δεδομένων.
Συγκριτικός πίνακας
Παράμετροι σύγκρισης | Αποσύνθεση μοναδικής τιμής (SVD) | Ανάλυση κύριων συστατικών (PCA) |
---|---|---|
απαιτήσεις | Τα αφηρημένα μαθηματικά, η αποσύνθεση πινάκων και η κβαντική φυσική απαιτούν όλα SVD. | Οι στατιστικές είναι ιδιαίτερα αποτελεσματικές στην PCA για την ανάλυση δεδομένων από την έρευνα. |
Έκφραση | Παραγοντοποίηση αλγεβρικών εκφράσεων. | παρόμοια με την προσέγγιση παραγοντοποιημένων εκφράσεων. |
Μέθοδοι | Είναι μια μέθοδος στα αφηρημένα μαθηματικά και στην αποσύνθεση πινάκων. | Είναι μια μέθοδος στη Στατιστική/Μηχανική Μάθηση. |
Υποκατάστημα | Χρήσιμο στον κλάδο των μαθηματικών. | Χρήσιμο στον κλάδο των μαθηματικών. |
Εφεύρεση | Το SVD επινοήθηκε από τον Eugenio Beltrami και την Camille Jordan. | Το PCA επινοήθηκε από τον Karl Pearson. |
Τι είναι η αποσύνθεση μοναδικής αξίας (SVD);
Το SVD συνδέεται στενά με το μέρος της παραγοντοποίησης της ιδιοτιμής και του ιδιοδιανύσματος ενός θετικού ορισμένου πίνακα.
Αν και δεν μπορούν να παραγοντοποιηθούν όλοι οι πίνακες ως pt, οποιοσδήποτε m×n πίνακας A μπορεί να παραγοντοποιηθεί επιτρέποντάς του στα αριστερά και στο PT στα δεξιά να είναι δύο ορθογώνια πίνακες U και vt (όχι απαραίτητα η μία από την άλλη).
Αυτός ο τύπος ειδικής παραγοντοποίησης είναι γνωστός ως SVD.
Οι επεκτάσεις ημιτόνου και συνημιτόνου χρησιμοποιούνται σε όλα τα μαθηματικά για την προσέγγιση των συναρτήσεων και το FT είναι ένας από τους πιο χρήσιμους μετασχηματισμούς. Υπάρχουν επίσης λειτουργίες Bessel και Airy, καθώς και σφαιρικές αρμονικές.
Και, στην προηγούμενη γενιά της επιστήμης των υπολογιστών και της μηχανικής, αυτό το μαθηματικό μοντέλο μαθηματικού μετασχηματισμού χρησιμοποιήθηκε για τη μεταφορά ενός συστήματος ενδιαφέροντος σε ένα νέο σύστημα συντεταγμένων.
Ένας από τους σημαντικότερους αλγόριθμους είναι ο SVD. Θα μπορούσε κανείς να χρησιμοποιήσει τη γραμμική άλγεβρα για να δημιουργήσει έσοδα.
Μία από τις πιο χρήσιμες πτυχές της χρήσης της γραμμικής άλγεβρας για την επίτευξη κέρδους είναι ότι είναι ευρέως διαδεδομένη καθώς βασίζεται σε πολύ απλή και ευανάγνωστη γραμμική άλγεβρα που μπορεί να χρησιμοποιηθεί ανά πάσα στιγμή.
Αν έχετε Data Matrix, μπορείτε να υπολογίσετε το svd και να λάβετε ερμηνεύσιμα και κατανοητά χαρακτηριστικά από τα οποία μπορείτε να δημιουργήσετε μοντέλα. Είναι επίσης επεκτάσιμο, επομένως μπορεί να χρησιμοποιηθεί σε πολύ μεγάλα σύνολα δεδομένων.
Κάθε παράγοντας μήτρας χωρίζεται σε τρία μέρη, τα οποία είναι γνωστά ως u Sigma v transpose. Ένας ορθογώνιος πίνακας είναι ένα συστατικό u. Ο διαγώνιος Matrix είναι ο παράγοντας Sigma.
Η μετατόπιση παράγοντα v είναι επίσης μια ορθογώνια μήτρα, καθιστώντας την ορθογώνια διαγώνια ή σωματικά τεντωμένη και περιστρεφόμενη.
Κάθε Πίνακας συνυπολογίζεται σε έναν ορθογώνιο Πίνακα πολλαπλασιάζοντάς τον με έναν διαγώνιο Πίνακα (την ενική τιμή) με έναν άλλο ορθογώνιο Πίνακα: περιστροφή, χρονική έκταση, φορές περιστροφή.
Τι είναι το Principal Component Analysis (PCA);
Η PCA είναι μια καθιερωμένη μέθοδος που έχει εισαγάγει πολλές θεωρίες σχετικά με τις στατιστικές. Ισοδυναμεί με την προσέγγιση μιας παραγοντοποιημένης δήλωσης διατηρώντας τους «μεγαλύτερους» όρους και εξαλείφοντας όλους τους μικρότερους όρους.
Είναι μια καθιερωμένη μέθοδος που έχει εισαγάγει πολλές θεωρίες σχετικά με τη στατιστική. Συγκεκριμένα, η PCA μας παρέχει ένα ιεραρχικό σύστημα συντεταγμένων που βασίζεται σε δεδομένα.
Η ανάλυση κύριου συστατικού (PCA) αναφέρεται ως κατάλληλη ορθογώνια αποσύνθεση. Το PCA είναι μια μέθοδος για τον εντοπισμό προτύπων στα δεδομένα ορίζοντας τα ως προς τις ομοιότητες και τις διαφορές.
Στο PCA, υπάρχει ένας πίνακας δεδομένων X που περιέχει μια συλλογή μετρήσεων από διαφορετικά πειράματα και δύο ανεξάρτητα πειράματα αντιπροσωπεύονται ως συντελεστές μεγάλων σειρών στα x1, x2 κ.λπ.
Το PCA είναι μια προσέγγιση μείωσης διαστάσεων που μπορεί να βοηθήσει στη μείωση των διαστάσεων των συνόλων δεδομένων που χρησιμοποιούνται στην εκπαίδευση μηχανικής μάθησης. Μετριάζει την επίφοβη κατάρα της διάστασης.
Το PCA είναι μια μέθοδος για τον προσδιορισμό των πιο σημαντικών χαρακτηριστικών ενός κύριου στοιχείου που έχουν τη μεγαλύτερη επιρροή στη μεταβλητή στόχο. Το PCA αναπτύσσει ένα νέο στοιχείο αρχής χαρακτηριστικών.
Κύριες διαφορές μεταξύ Αποσύνθεση μοναδικής τιμής (SVD) και ανάλυση κύριου στοιχείου (PCA)
- Το SVD είναι άμεσα συγκρίσιμο με factoring αλγεβρικές εκφράσεις, ενώ το PCA ισοδυναμεί με την προσέγγιση μιας παραγοντοποιημένης πρότασης διατηρώντας τους «μεγαλύτερους» όρους και εξαλείφοντας όλους τους μικρότερους όρους.
- Οι τιμές στο SVD είναι σταθεροί αριθμοί και η παραγοντοποίηση είναι η διαδικασία αποσύνθεσής τους, ενώ το PCA είναι ένας τρόπος στατιστικής/μηχανικής νοημοσύνης για τον προσδιορισμό των κύριων πτυχών.
- Η αποσύνθεση της μήτρας σε ορθοκανονικές περιοχές είναι γνωστή ως SVD, ενώ η PCA μπορεί να υπολογιστεί χρησιμοποιώντας SVD, αν και έχει υψηλότερη τιμή.
- Το SVD είναι ένα από τα πιο ευρέως χρησιμοποιούμενα και χρήσιμα χαρακτηριστικά για όλες τις χρήσεις στην αριθμητική γραμμική άλγεβρα για την απόκτηση δεδομένων, ενώ η PCA είναι μια καθιερωμένη μέθοδος που έχει εισαγάγει πολλές θεωρίες σχετικά με τη στατιστική.
- Ο SVD είναι ένας από τους εξέχοντες αλγόριθμους, ενώ ο PCA είναι μια προσέγγιση μείωσης διαστάσεων.
- https://www.hindawi.com/journals/acisc/2021/6686759/
- https://www.tandfonline.com/doi/abs/10.1198/106186007X256080
Τελευταία ενημέρωση: 13 Ιουλίου, 2023
Η Emma Smith είναι κάτοχος μεταπτυχιακού διπλώματος στα αγγλικά από το Irvine Valley College. Είναι Δημοσιογράφος από το 2002, αρθρογραφώντας για την αγγλική γλώσσα, τον αθλητισμό και το δίκαιο. Διαβάστε περισσότερα για μένα σε αυτήν βιο σελίδα.