Spelling suggestions: "subject:"klasifikacija"" "subject:"klasifikaci""
1 |
Klasifikavimo su mokytoju metodų lyginamoji analizė / A comparative analysis of supervised classification methodsŠimkevičius, Simonas 05 June 2006 (has links)
Supervised classification methods are applied in many fields. The main problem of applying these methods is how to select the most appropriate method in particular case. The literary review was fulfilled and the advantages and disadvantages of mostly used criterion of supervised classification methods comparisons were ascertained. Then the methodology of comparisons was suggested. The analysis of SAS system procedures and macro commands was made. It was ascertained that there is not comfortable software which allows comparing the results of supervised classification methods. This work demands a lot of work, good knowledge of SAS programming language and high qualification in programming. So, the main purpose of this work is to expand the statistical data analysis system SAS possibilities in comparison of supervised classification methods and classificate various data.
In this work the possibilities of SAS system are expanded by the tool which allows comparing quality of the linear, quadratic, kernel, nearest neighbor’s discriminant analysis and logistic regression analysis methods. There were used classification error estimates which were got by resubstition, cross–validation leave one out, bootstrap and Monte Carl cross–validation methods, although classification error confidence intervals which were got by non-parametric bootstrap method. The test of created tool was made with various data (different sample sizes, various classis separability, violations of assumptions... [to full text]
|
2 |
Garsų trukmių modelių kūrimo metodas, naudojant didelės apimties daugelio kalbėtojų garsyną / Method for creating phone duration models using very large, multi-speaker, automatically annotated speech corpusNorkevičius, Giedrius 01 February 2011 (has links)
Disertacijoje nagrinėjamos dvi iki šiol netyrinėtos problemos:
1. Lietuvių kalbos garsų trukmių prognozavimo modelių kūrimas
Iki šiol visi darbai, kuriuose yra nagrinėjamos lietuvių kalbos garsų trukmės, yra atlikti kalbininkų, tačiau šie tyrimai yra daugiau aprašomosios statistikos pobūdžio ir apsiriboja pavienių požymių įtakos garso trukmei analize. Šiame darbe, mašininio mokymo algoritmo pagalba, požymių įtaka garsų trukmei yra išmokstama iš duomenų ir užrašoma sprendimo medžio pavidalu.
2. Nuo kalbos nepriklausomų garsų trukmių prognozavimo modelių kūrimo metodas, naudojant didelės apimties daugelio, kalbėtojų automatiškai, anotuotą garsyną.
Dėl skirtingų kalbėtojų tarties specifikos ir dėl automatinio anotavimo netikslumų, kuriant garsų trukmės modelius visame pasaulyje yra apsiribojama vieno kalbėtojo ekspertų anotuotais nedidelės apimties garsynais. Darbe pasiūlyti skirtingų kalbėtojų tarties ypatybių normalizavimo ir garsyno duomenų triukšmo atmetimo algoritmai leidžia garsų trukmių modelių kūrimui naudoti didelės apimties, daugelio kalbėtojų automatiškai anotuotus garsynus.
Darbo metu atliktas audicinis tyrimas, kurio pagalba parodoma, kad šnekos signalą sudarančių garsų trukmės turi įtakos klausytojų/respondentų suvokiamam šnekos signalo natūralumui; kontekstinės informacijos panaudojimas garsų trukmių prognozavimo uždavinio sprendime yra svarbus faktorius įtakojantis sintezuotos šnekos natūralumą; natūralaus šnekos signalo atžvilgiu, geriausiai vertinamas yra... [toliau žr. visą tekstą] / Two heretofore unanalyzed aspects are addressed in this dissertation:
1. Building a model capable of predicting phone duration of Lithuanian.
All existing investigations of phone durations of Lithuanian were performed by linguists. Usually these investigations are the kind of exploratory statistics and are limited to a single factor, affecting phone duration, analysis. Phone duration dependencies on contextual factors were estimated and written in explicit form (decision tree) in this work by means of machine learning method.
2. Construction of language independent method for creating phone duration models using very large, multi-speaker, automatically annotated speech corpus.
Most of the researchers worldwide use speech corpus that are: relatively small scale, single speaker, manually annotated or at least validated by experts. Usually the referred reasons are: using multi-speaker speech corpora is inappropriate because different speakers have different pronunciation manners and speak in different speech rate; automatically annotated corpuses lack accuracy. The created method for phone duration modeling enables the use of such corpus. The main components of the created method are: the reduction of noisy data in speech corpus; normalization of speaker specific phone durations by using phone type clustering.
The performed listening tests of synthesized speech, showed that: the perceived naturalness is affected by the underlying phones durations; The use of contextual... [to full text]
|
3 |
Klasterinės ir diskriminantinės analizės taikymai mokinių pasiekimų tyrimui / The application of Cluster and Discriminant analysis in students achievements researchLazdauskaitė, Sandra 16 August 2007 (has links)
Nacionalinių mokinių pasiekimų tyrimo metodologija yra nuolat plėtojama. Pasitarus su Švietimo plėtotės centro tyrimo skyriaus darbuotojais, buvo nuspręsta įsigilinti į klasterinės ir diskriminantinės analizės metodus, jų pritaikomumą nacionalinių tyrimų rezultatų analizei. Tai įtakojo šio darbo pasirinkimą ir tikslą - susipažinti su Klasterinės ir Diskriminantinės analizės metodais, pateikti ir aptarti jų taikymo pavyzdžius. Darbe išnagrinėti du daugiamačiai statistiniai metodai: klasterinė ir diskriminantinė analizė. Yra aptarti šių metodų teoriniai aspektai bei pateikti originalūs šių metodų pritaikymo mokinių pasiekimų tyrimams pavyzdžiai. Padarytos išvados apie šių metodų pritaikomumą nacionalinių mokinių pasiekimų tyrimo analizei atlikti. / National research of student marches are continually evolving. With Educational evolve center’s help I decided to analyse Cluster and Disckriminant analysis methods and how they can be used in National research analysis. This was a reason of my work purpose - to have a look at Cluster and Disckriminant analysis methods, to offer examples of practical use. There are two statistical multidimensional methods discussed in this work (Cluster and Disckriminant analysis). There are discussed theoretical side of these methods, also you can find original examples of practical use. In conclusion I discuss about practical use of these methods in national research of student marches.
|
4 |
Tarifinio prekių klasifikavimo įtaka antidempingo muitų surinkimui / Influence of the tariff goods classification for the collection of antidumping customs dutiesZabalevičius, Justas 03 June 2014 (has links)
Šiame magistro baigiamajame darbe nagrinėjama tema „Tarifinio prekių klasifikavimo įtaka antidempingo muitų surinkimui“. Darbo tikslas – išanalizuoti tarifinio klasifikavimo taisykles ir principus bei jų taikymą praktikoje, siekiant atskleisti galimus antidempingo muitų netaikymo atvejus Lietuvos muitinėje. Darbo tikslas nurodo bendrą magistrinio darbo kryptį bei orientuojasi į problemos analizę teorine ir taikomąja prasme. Todėl darbe į tarifinio prekių klasifikavimo ir antidempingo muitų nustatymo vertinimą sritį žvelgiu per muitinės kontrolės prizmę. / The topic "Influence of the tariff goods classification for the collection of anti-dumping customs duties" is presented in this Master's concluding thesis. The goal of the work is to analyze the rules and principles of the tariff classification and their application in practice in order to disclose the possible non-application cases of anti-dumping customs duties in the Customs Department of Lithuania. The goal of the work indicates the general trend of the Master's work and is orientated towards the analysis of this problem in terms of theoretical and application aspects. Therefore, I am looking at the assessing sphere of the tariff goods classification and determination of anti-dumping customs duties through the control of the Customs Duties.
|
5 |
Method for creating phone duration models using very large, multi-speaker, automatically annotated speech corpus / Garsų trukmių modelių kūrimo metodas, naudojant didelės apimties daugelio kalbėtojų garsynąNorkevičius, Giedrius 01 February 2011 (has links)
Two heretofore unanalyzed aspects are addressed in this dissertation:
1. Building a model capable of predicting phone duration of Lithuanian.
All existing investigations of phone durations of Lithuanian were performed by linguists. Usually these investigations are the kind of exploratory statistics and are limited to a single factor, affecting phone duration, analysis. Phone duration dependencies on contextual factors were estimated and written in explicit form (decision tree) in this work by means of machine learning method.
2. Construction of language independent method for creating phone duration models using very large, multi-speaker, automatically annotated speech corpus.
Most of the researchers worldwide use speech corpus that are: relatively small scale, single speaker, manually annotated or at least validated by experts. Usually the referred reasons are: using multi-speaker speech corpora is inappropriate because different speakers have different pronunciation manners and speak in different speech rate; automatically annotated corpuses lack accuracy. The created method for phone duration modeling enables the use of such corpus. The main components of the created method are: the reduction of noisy data in speech corpus; normalization of speaker specific phone durations by using phone type clustering.
The performed listening tests of synthesized speech, showed that: the perceived naturalness is affected by the underlying phones durations; The use of contextual... [to full text] / Disertacijoje nagrinėjamos dvi iki šiol netyrinėtos problemos:
1. Lietuvių kalbos garsų trukmių prognozavimo modelių kūrimas
Iki šiol visi darbai, kuriuose yra nagrinėjamos lietuvių kalbos garsų trukmės, yra atlikti kalbininkų, tačiau šie tyrimai yra daugiau aprašomosios statistikos pobūdžio ir apsiriboja pavienių požymių įtakos garso trukmei analize. Šiame darbe, mašininio mokymo algoritmo pagalba, požymių įtaka garsų trukmei yra išmokstama iš duomenų ir užrašoma sprendimo medžio pavidalu.
2. Nuo kalbos nepriklausomų garsų trukmių prognozavimo modelių kūrimo metodas, naudojant didelės apimties daugelio, kalbėtojų automatiškai, anotuotą garsyną.
Dėl skirtingų kalbėtojų tarties specifikos ir dėl automatinio anotavimo netikslumų, kuriant garsų trukmės modelius visame pasaulyje yra apsiribojama vieno kalbėtojo ekspertų anotuotais nedidelės apimties garsynais. Darbe pasiūlyti skirtingų kalbėtojų tarties ypatybių normalizavimo ir garsyno duomenų triukšmo atmetimo algoritmai leidžia garsų trukmių modelių kūrimui naudoti didelės apimties, daugelio kalbėtojų automatiškai anotuotus garsynus.
Darbo metu atliktas audicinis tyrimas, kurio pagalba parodoma, kad šnekos signalą sudarančių garsų trukmės turi įtakos klausytojų/respondentų suvokiamam šnekos signalo natūralumui; kontekstinės informacijos panaudojimas garsų trukmių prognozavimo uždavinio sprendime yra svarbus faktorius įtakojantis sintezuotos šnekos natūralumą; natūralaus šnekos signalo atžvilgiu, geriausiai vertinamas yra... [toliau žr. visą tekstą]
|
6 |
Genetinių algoritmų pritaikymo klasifikavimo uždaviniams spręsti tyrimas / Genetic Algorithms in Classification tasks solvingBalnys, Mantas 28 May 2004 (has links)
Neural networks are one of the most efficient classifier methods. One of such classifying neural networks we are trying to teach in this work by using genetic algorithms. In this work we test two types of genetic algorithms. One may be called parameterized genetic algorithm. It is built on the basic ideas of genetic algorithms. The other one is called parameter less genetic algorithm. It was presented by F. G. Lobo and D. E. Goldberg. Both genetic algorithms are tested and compared to the other well known optimization methods such as Bayes and Monte Carlo search. Experiments show the relevance of use genetic algorithms in teaching classifying neural network. Also stated that parameter less genetic algorithm works more efficient than parametric genetic algorithm in general cases. Created programs will be used in future studies.
|
7 |
Veiklos taisyklių klasifikavimo ir specifikavimo metodų tyrimas / The research on business rules classification and specification methodsBaltrušaitis, Egidijus 23 May 2005 (has links)
The work is based on the research of business rules classification and specification methods. The basics of business rules approach are discussed. The most common business rules classification and modeling methods are analyzed. Business rules modeling techniques and tools for supporting them in the information systems are presented. Basing on the analysis results business rules classification method is proposed. Templates for every business rule type are presented. Business rules structuring process is shortly described. Business rules repository architecture, which is based on the proposed classification method, is presented. Proposed repository can store all types of business rules of defined classification method. Rules in the database are stored linked with events which are grouped by business functions. Such rules storing makes repository structure more flexible and more adaptive in information systems. Repository can function as an independent database for storing business rules and can be fully integrated in to the rule based information system. Rule specification tool for business rules registering and viewing was created. This tool has a simple user interface which allows register business rules and provides first steps in formalizing business statements. Finally conclusions are presented.
|
8 |
Terapinio profilio slaugytojų darbo laiko sąnaudų ryšio su pacientų savarankiškumu vertinimas / The relationship of nurses' time to the level of patient independence on an inpatient therapeutic unitSuprikienė, Roberta 11 July 2014 (has links)
Darbo tikslas – įvertinti terapinio profilio slaugytojų darbo laiko sąnaudų ryšį su pacientų savarankiškumu.
Uždaviniai: 1. Išanalizuoti terapinio profilio slaugytojų darbo laiko sąnaudas pagal priežiūros kategorijas ir slaugytojo veiklų grupes. 2. Nustatyti terapinio profilio pacientų savarankiškumo lygmenį. 3. Išanalizuoti terapinio profilio slaugytojų darbo laiko sąnaudas, atsižvelgiant į pacientų savarankiškumo lygmenį.
Tyrimo metodika. Tyrimas atliktas VšĮ Vilkaviškio ligoninės trijuose terapinio profilio skyriuose (vidaus ligų, neurologijos, slaugos ir palaikomojo gydymo). Tyrimo trukmė - 3,5 mėn. Naudotas tiesioginis laiko ir slaugytojo veiksmų stebėjimo metodas (angl. time-and-motion studies). Iš viso atlikta 72 stebėjimai, kurie sudarė 777,2 val. slaugytojų darbo laiko sąnaudų. Pacientų savarankiškumas vertintas anketa.
Rezultatai: Terapinio profilio slaugytojų didžiausios darbo laiko sąnaudos dienos (46,6 proc.) ir nakties (28,3 proc.) pamainoje skirtos tiesioginei pacientų priežiūrai. Mažiausia dalis slaugytojų darbo laiko praleista netiesioginei pacientų priežiūrai. Terapinio profilio skyriuose didžioji dalis pacientų (40,1 proc.) buvo savarankiški, 22,3 priklausomi ir 16 proc. - visiškai priklausomi. Slaugytojai per dvi darbo pamainas (dienos ir nakties), pusę savo darbo laiko skyrė visiškai priklausomiems pacientams slaugyti ir prižiūrėti, ketvirtadalį laiko - priklausomiems pacientams ir mažiausiai, t.y. 14 proc. - savarankiškiems pacientams.
Išvados: 1... [toliau žr. visą tekstą] / Purpose – to evaluate the relationship between time spent caring a patient by nurses on a medical unit and the patients‘ levels of independence.
Objectives: 1. Analyze time spent caring for a patient by nurses on a medical unit according to care categories and nurses activity groups. 2. Determine patients‘ independence levels on a medical unit. 3. Analyze time spent caring for patients according to independence levels by nurses on a medical unit.
Methods. The study was completed at Vilkaviškis Hospital, in three medical units (internal medicine, neurology and nursing and hospice care) The length of the study was 3.5 months. Data was gathered through time and motion observation. Seventy-two observations yielded 777.2 hours of observed nursing time. Patient independence was evaluated using a questionnaire.
Results: On medical units, the majority of nursing time during the day (46,6%) and night (28,3%) shifts is dedicated to direct patient care. The least amount of nursing time is spent in indirect patient care. On the medical units, a large number of patients (40,1%) were independent, 22,3% needed partial care and 16%. required total care. Nurses during two shifts (day and night) spent half their time providing total care to patients, a quarter of their time providing partial care and the least amount of time, i.e., 14%, providing care to independent patients.
Conclusions: 1. Almost half of the nursing shift is spent in direct patient care; much time was spent administering... [to full text]
|
9 |
Klientų duomenų valdymas bankininkystėje / Client data management in bankingŽiupsnys, Giedrius 09 July 2011 (has links)
Darbas apima banko klientų kredito istorinių duomenų dėsningumų tyrimą. Pirmiausia nagrinėjamos banko duomenų saugyklos, siekiant kuo geriau perprasti bankinius duomenis. Vėliau naudojant banko duomenų imtis, kurios apima kreditų grąžinimo istoriją, siekiama įvertinti klientų nemokumo riziką. Tai atliekama adaptuojant algoritmus bei programinę įrangą duomenų tyrimui, kuris pradedamas nuo informacijos apdorojimo ir paruošimo. Paskui pritaikant įvairius klasifikavimo algoritmus, sudarinėjami modeliai, kuriais siekiama kuo tiksliau suskirstyti turimus duomenis, nustatant nemokius klientus. Taip pat siekiant įvertinti kliento vėluojamų mokėti paskolą dienų skaičių pasitelkiami regresijos algoritmai bei sudarinėjami prognozės modeliai. Taigi darbo metu atlikus numatytus tyrimus, pateikiami duomenų vitrinų modeliai, informacijos srautų schema. Taip pat nurodomi klasifikavimo ir prognozavimo modeliai bei algoritmai, geriausiai įvertinantys duotas duomenų imtis. / This work is about analysing regularities in bank clients historical credit data. So first of all bank information repositories are analyzed to comprehend banks data. Then using data mining algorithms and software for bank data sets, which describes credit repayment history, clients insolvency risk is being tried to estimate. So first step in analyzis is information preprocessing for data mining. Later various classification algorithms is used to make models wich classify our data sets and help to identify insolvent clients as accurate as possible. Besides clasiffication, regression algorithms are analyzed and prediction models are created. These models help to estimate how long client are late to pay deposit. So when researches have been done data marts and data flow schema are presented. Also classification and regressions algorithms and models, which shows best estimation results for our data sets, are introduced.
|
Page generated in 0.0602 seconds