Return to search

Хијерархијско кластеровање модела Гаусових смеша у апликацијама за континуално препознавање говора / Hijerarhijsko klasterovanje modela Gausovih smeša u aplikacijama za kontinualno prepoznavanje govora / Hierarchical Clustering of GaussianMixture Models in Applications forContinuous Speech Recognition

<p>У оквиру докторске дисертације<br />представљен је нови алгоритам<br />хијерархијског кластеровања модела<br />Гаусових смеша, заснован на операцији<br />поделе и спајања. Алгоритам тежи<br />побољшању локално оптималног<br />решења одређеног иницијалном<br />констелацијом. Иницијализује се<br />локално оптималним параметрима,<br />добијеним коришћењем референтног<br />приступа сличног k‐means‐у и тежи ка<br />приближавању глобалном оптимуму<br />функције циља, итеративном<br />применом операција поделе и спајања<br />над кластерима Гаусових компоненти,<br />одређеним применом референтног<br />алгоритма.<br />Додатно побољшање алгоритма<br />осварено је увођењем принципа<br />селекције модела у сврху одређивања<br />најповољнијег односа тачности и<br />рачунске сложености, у задатку&nbsp;<span style="font-size: 12px;">селекције гаусијана унутар реалног</span></p><p>система за препознавање. Предложени<br />метод тестиран је како над вештачки<br />генерисаним подацима, тако и у<br />оквиру алгоритма селекције гаусијана,<br />на примеру система за континуално<br />препознавање говора. У оба случаја<br />забележено је побољшање резултата у<br />односу на резултате остварене<br />применом референтног алгоритма.<br />Побољшања алгоритма селекције<br />гаусијана избором оптималног скупа<br />системских параметара такође су<br />размотрена.</p> / <p>U okviru doktorske disertacije<br />predstavljen je novi algoritam<br />hijerarhijskog klasterovanja modela<br />Gausovih smeša, zasnovan na operaciji<br />podele i spajanja. Algoritam teži<br />poboljšanju lokalno optimalnog<br />rešenja određenog inicijalnom<br />konstelacijom. Inicijalizuje se<br />lokalno optimalnim parametrima,<br />dobijenim korišćenjem referentnog<br />pristupa sličnog k‐means‐u i teži ka<br />približavanju globalnom optimumu<br />funkcije cilja, iterativnom<br />primenom operacija podele i spajanja<br />nad klasterima Gausovih komponenti,<br />određenim primenom referentnog<br />algoritma.<br />Dodatno poboljšanje algoritma<br />osvareno je uvođenjem principa<br />selekcije modela u svrhu određivanja<br />najpovoljnijeg odnosa tačnosti i<br />računske složenosti, u zadatku&nbsp;<span style="font-size: 12px;">selekcije gausijana unutar realnog</span></p><p>sistema za prepoznavanje. Predloženi<br />metod testiran je kako nad veštački<br />generisanim podacima, tako i u<br />okviru algoritma selekcije gausijana,<br />na primeru sistema za kontinualno<br />prepoznavanje govora. U oba slučaja<br />zabeleženo je poboljšanje rezultata u<br />odnosu na rezultate ostvarene<br />primenom referentnog algoritma.<br />Poboljšanja algoritma selekcije<br />gausijana izborom optimalnog skupa<br />sistemskih parametara takođe su<br />razmotrena.</p> / <p>The dissertation presents a novel splitand‐<br />merge algorithm for hierarchical<br />clustering of Gaussian mixture models.<br />The algorithm tends to improve on the<br />local optimal solution determined by the<br />initial constellation. It is initialized by<br />local optimal parameters obtained by<br />using a baseline approach similar to kmeans,<br />and it tends to approach more<br />closely to the global optimum of the<br />target clustering function, by iteratively<br />splitting and merging the clusters of<br />Gaussian components obtained as the<br />output of the baseline algorithm.<br />The algorithm is further improved by<br />introducing model selection in order to<br />obtain the best possible trade‐off<br />between recognition accuracy and<br />computational load in a Gaussian<br />selection task applied within an actual<br />recognition system. The proposed<br />method is tested both on artificial data<br />and in the framework of Gaussian<br />selection performed within a real&nbsp;<span style="font-size: 12px;">continuous speech recognition system. In</span></p><p>both cases an improvement over the<br />baseline method has been observed.<br />Additional improvements of Gaussian<br />selection algorithm by using the optimal<br />set of system parameters are also<br />discussed.</p>

Identiferoai:union.ndltd.org:uns.ac.rs/oai:CRISUNS:(BISIS)83376
Date17 July 2012
CreatorsPopović Branislav
ContributorsDelić Vlado, Trpovski Željen, Jovičić Slobodan, Grbić Tatjana, Sečujski Milan
PublisherUniverzitet u Novom Sadu, Fakultet tehničkih nauka u Novom Sadu, University of Novi Sad, Faculty of Technical Sciences at Novi Sad
Source SetsUniversity of Novi Sad
LanguageSerbian
Detected LanguageUnknown
TypePhD thesis
Formatapplication/pdf

Page generated in 0.0034 seconds