Φασματικό κεντροειδές

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Μετάβαση σε: πλοήγηση, αναζήτηση

Το φασματικό κεντροειδές είναι ένα χαρακτηριστικό το οποίο χρησιμοποιείται στην ανάλυση ηχητικών σημάτων. Ανήκει στην κατηγορία των φασματικών ηχητικών χαρακτηριστικών, εφόσον απαιτεί τον υπολογισμό του διακριτού μετασχηματισμού Fourier του προς ανάλυση σήματος.

Ορισμός[Επεξεργασία | επεξεργασία κώδικα]

Τα φασματικά ηχητικά χαρακτηριστικά χρησιμοποιούν σαν βάση τον βραχυπρόθεσμο μετασχηματισμό Fourier (short-time Fourier Transform - STFT) του ηχητικού σήματος. Έστω, X_{i}(k), k=1 \ldots, N, οι συντελεστές του διακριτού μετασχηματισμού Fourier (DFT) του i-οστού βραχυπρόθεσμου παραθύρου, όπου $N$ είναι το μήκος του παραθύρου.

Το φασματικό κεντροειδές C_{i} του i-οστού παραθύρου ορίζεται ως το "κέντρο βάρους" του φάσματος, δηλαδή,


C_i=\frac{\sum_{k=1}^{N}(k+1)X_{i}(k)}{\sum_{k=1}^{N}X_{i}(k)}

Ιδιότητες - Χρήση[Επεξεργασία | επεξεργασία κώδικα]

Το συγκεκριμένο ηχητικό χαρακτηριστικό είναι ένα μέτρο της φασματικής θέσης, ενώ υψηλές τιμές του χαρακτηριστικού αντιστοιχούν σε πιο "έντονους" ήχους. Σύμφωνα με πειράματα, η ακολουθία του φασματικού κεντροειδούς έχει υψηλές διακυμάνσεις για σήματα ομιλίας, και για τον λόγο αυτό, έχει χρησιμοποιηθεί (εκτός των άλλων) σε μεθόδους διαχωρισμού ομιλίας - μουσικής (speech music discrimination) [1] [2]

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]

  1. Theodoros Giannakopoulos, Study and application of acoustic information for the detection of harmful content, and fusion with visual information, PhD Thesis, University of Athens, 2009
  2. Sergios Theodoridis, Konstantinos Koutroumbas, Pattern Recognition , Fourth Edition, Academic Press, 2009, ISBN 978-1-59749-272-0.