Return to search

Functional dependency detection: an information theoretic algorithm

There are many statistical measures of correlation, such as Pearson's correlation coefficient for real random variables, the chi-square statistic for discrete random variables, and mutual information. Most such measures are symmetric and do not allow detection of influence direction. We propose a novel information theory measure whose value indicates direction of functional dependency. The measure calculation algorithm is performed on real-valued data being quantized into bins. This quantization is a corner stone of the algorithm suggested, as it affects both the statistical significance between the variables being tested for dependency and the numeric strength of dependency. / Il existe de nombreuses mesures statistiques de corrélation, tels que le Pearson coefficient de corrélation des variables aléatoires, le chi-carré pour les variables aléatoires discrètes et, finalement, l'information mutuelle. La plupart de ces mesures sont symétriques et ne pas permettre la détection d'influence. Nous proposons une nouvelle mesure de l'information-théorique dont la valeur indique la direction de le dépendence fonctionnelle. La mesure algorithme de calcul est effectué sur la valeur réelle de données quantifiées en bacs. Cette quantification est une fondation de l'algorithme proposé, car elle informe à la fois la signification statistique entre les variables et la force de la dépendance.

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QMM.32553
Date January 2009
CreatorsOphir, Adi
ContributorsTheodore J Perkins (Internal/Supervisor)
PublisherMcGill University
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation
Formatapplication/pdf
CoverageMaster of Science (School of Computer Science)
RightsAll items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.
RelationElectronically-submitted theses.

Page generated in 0.0124 seconds