Global ETD Search

1	Formação de portfólio por meio de máquinas de suporte vetorial e redes de camadas profundas Marcelino, Sarah Sabino de Freitas 17 November 2016 (has links) Dissertação (mestrado)—Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Administração, 2016. / Submitted by Fernanda Percia França (fernandafranca@bce.unb.br) on 2017-04-05T19:39:05Z No. of bitstreams: 1 2016_SarahSabinodeFreitasMarcelino.pdf: 5399626 bytes, checksum: d02fde50fe4d59702e2bb72183833fa9 (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2017-04-13T18:45:41Z (GMT) No. of bitstreams: 1 2016_SarahSabinodeFreitasMarcelino.pdf: 5399626 bytes, checksum: d02fde50fe4d59702e2bb72183833fa9 (MD5) / Made available in DSpace on 2017-04-13T18:45:41Z (GMT). No. of bitstreams: 1 2016_SarahSabinodeFreitasMarcelino.pdf: 5399626 bytes, checksum: d02fde50fe4d59702e2bb72183833fa9 (MD5) / Este estudo teve como objetivo verificar se o uso de Máquinas de Suporte Vetorial contribui para que o retorno do portfólio seja superior ao Mercado. A amostra desta pesquisa foram as ações do S&P 100. Na primeira aplicação, utilizou-se o Support Vector Regression com 15 tipos de Kernels diferentes. Na segunda aplicação, utilizou-se o SVM de classificação para formar portfólios e estes também foram comparados com o benchmark de mercado. Aqui utilizou-se apenas o Kernel Gaussiano e foram analisados o impacto das variáveis inseridas como inputs e o impacto do uso de custos de erro diferentes para cada classe. Na terceira aplicação desta dissertação, o SVR foi utilizado com 9 diferentes tipos de Kernel Arco- Cosseno Compostos que imitam o processo computacional em grandes redes neurais de múltiplas camadas e apresentam algumas das vantagens do Deep Learning. Na primeira e na segunda aplicação da pesquisa, o SVM apresentou resultados de acurácia satisfatórios aliados com valores de retorno e risco bastante promissores para os portfólios trimestrais. Porém, na terceira aplicação, os portfólios não mostraram-se superiores em termos de retorno e nem em termos de risco. Os resultados desta pesquisa corroboram a hipótese de superioridade do método inovador das Máquinas de Suporte Vetorial na formação de portfólios, caracterizado pela construção de um hiperplano pela implementação do Princípio da Minimização do Risco Estrutural, o qual procura minimizar o limite superior do erro de generalização, em vez de minimizar apenas o erro do processo de estimação. / This study aimed to verify whether the use of Support Vector Machines makes the portfolio return exceeds the market. The sample of this research consisted on the S&P 100 stocks. In the first application, Support Vector Regression was used with 15 different Kernels to select the bests stocks to form a portfolio. In the second application, the traditional SVM was used with Gaussian Kernel to form portfolios. The impact of more variables as inputs and the impact of using different error costs for each class were analyzed. In the third application, the SVR was used with 9 different types of Arc-Cosine Kernels that mimic the computational process in large neural networks of multiple layers and have some of the advantages of Deep Learning. In the first and second application of the research, the SVM presented satisfactory and very promising results for the quarterly portfolios. However, in the third application, the portfolios were not superior in terms of return neither in terms of risk. The results of this study corroborate the hypothesis of the superior and innovative method of Support Vector Machine in the selection of portfolios, characterized by the construction of a hyperplane for implementing the principle of minimization of structural risk, which seeks to minimize the upper limit of the error generalization, rather than just minimizing the error estimation process. Máquinas de vetores de suporte
2	Máquinas de suporte vetorial como instrumento de priorização de investimentos aplicado ao Programa de Investimento em Logística – Aeroportos Paula, Rubem Oliveira de 14 September 2016 (has links) Dissertação (mestrado)—Universidade de Brasília, Faculdade de Economia, Administração, Contabilidade e Gestão de Políticas Públicas, Departamento de Economia, Programa de Pós-Graduação em Economia, Mestrado em Economia e Gestão do Setor Público, 2016. / Submitted by Camila Duarte (camiladias@bce.unb.br) on 2017-02-06T15:42:32Z No. of bitstreams: 1 2016_RubemOliveiradePaula.pdf: 3197888 bytes, checksum: e158b63eeb724429bbc4ade24cf13191 (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2017-02-09T18:02:59Z (GMT) No. of bitstreams: 1 2016_RubemOliveiradePaula.pdf: 3197888 bytes, checksum: e158b63eeb724429bbc4ade24cf13191 (MD5) / Made available in DSpace on 2017-02-09T18:02:59Z (GMT). No. of bitstreams: 1 2016_RubemOliveiradePaula.pdf: 3197888 bytes, checksum: e158b63eeb724429bbc4ade24cf13191 (MD5) / Este estudo aborda a utilização de modelos de máquinas de suporte vetorial (SVM) como instrumento de priorização de investimentos públicos. Parte-se da apresentação das principais políticas públicas de investimento em aeroportos do Governo Federal Brasileiro: Programa de Investimento em Logística – Aeroportos e Plano Aeroviário Nacional. Para formação das bases e aplicação da metodologia, foi realizada a agregação dos municípios e informações de nível municipal em Zonas Aeroviárias. Foram utilizados kernels do tipo radial, mínimos quadrados radial, polinomial, linear e processo gaussiano de base radial, com diferentes parâmetros. Formulou-se um indicador de classificação de aeroportos de acordo com a operação ou não de voos regulares no período de 2004 a 2015, para posterior classificação de aeródromos passíveis ou não de receberem voos regulares. A partir de uma análise comparativa, observou-se que, em geral, os modelos SVM apresentaram resultados superiores ao modelo de mínimos quadrados ordinários, com especial diferença em relação ao perfil das Zonas Aeroviárias classificadas como recebedoras de voos regulares. / This study discusses the use of support vector machines´ (SVM) models as an instrument for prioritization of public investment. It starts presenting the main investment policies on airports carried by the Brazilian Federal Government: Programa de Investimento em Logística – Aeroportos e Plano Aeroviário Nacional. To constitute the data basis on which the application of the methodology was carried out, the municipalities and municipal level information are aggregated in Zonas Aeroviárias. Kernels of the radial type, least square radial, polynomial, linear and radial basis gaussian process, with different parameters were implemented. An index for airports classification according to the regularity of operation of flights has been formulated, taking the period from 2004 to 2015 as basis, to be applied to classify aerodromes by whether being subject or not to receive regular flights. After application on the databases and comparison of results from different models, it was observed that in general SVM models showed better results than an OLS model with particular difference to the profile of the Zonas Aeroviárias classified as receivers of scheduled flights. Máquinas de vetores de suporte Aeroportos - planejamento Investimentos públicos
3	A máquina de suporte vetorial aplicada em análise de séries temporais Andrade, Yuri Medeiros de 30 June 2017 (has links) Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2017. / Submitted by Raquel Almeida (raquel.df13@gmail.com) on 2017-07-20T12:11:07Z No. of bitstreams: 1 2017_YuriMedeirosdeAndrade.pdf: 1207207 bytes, checksum: d57c49f524d8870c0a3257d31861582d (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2017-09-19T16:37:37Z (GMT) No. of bitstreams: 1 2017_YuriMedeirosdeAndrade.pdf: 1207207 bytes, checksum: d57c49f524d8870c0a3257d31861582d (MD5) / Made available in DSpace on 2017-09-19T16:37:37Z (GMT). No. of bitstreams: 1 2017_YuriMedeirosdeAndrade.pdf: 1207207 bytes, checksum: d57c49f524d8870c0a3257d31861582d (MD5) Previous issue date: 2017-09-19 / Os modelos de aprendizado de máquina vêm tomando espaço na literatura moderna. Diversos artigos os comparam a métodos de séries temporais, pois devido à sua maleabilidade e adaptabilidade, conseguem facilmente se ajustar a diversos tipos de dados, sejam provenientes de modelos lineares ou não (Tay & Cao, 2001; Zhao et al., 2012). Este trabalho visou comparar os modelos tradicionais ARMA e GARCH à máquina de suporte vetorial para previsões um passo à frente na análise da volatilidade de séries temporais financeiras. Aqui foi analisado o desempenho de um híbrido AR-GARCH, aplicando diversas distribuições de probabilidade ao seu termo de ruído et, em relação ao desempenho de um novo método proposto por Chen et al. (2010) chamado de SVR recorrente. Modificamos o critério de parada desse novo e pouco conhecido método, para que se ajustasse melhor aos critérios estatísticos considerados por Morettin & Toloi (2006), no que diz respeito à estrutura de autocorrelação serial. Por fim, o aplicamos a dados gerados pelo modelo ARGARCH e a dois bancos de dados reais, iguais aos utilizados por Chen et al. (2010), para compararmos o desempenho do SVR recorrente, com o novo critério de parada, aos modelos GARCH, ARMA e ARGARCH. / Machine learning models have been taking space in modern literature. Several articles compare them to time series methods because, due to their malleability and adaptability, they can be easily adjusted to different types of data, whether linear or non-linear (Tay & Cao, 2001; Zhao et al., 2012). This work aimed to compare the traditional ARMA and GARCH models to the support vector machine for predictions one step ahead in the analysis of the volatility of financial time series. Here we analyzed the performance of an AR-GARCH hybrid applying several probability distributions to its noise term et, in relation to the performance of a new method proposed by Chen et al. (2010) called recurrent SVR. We modified the stopping criterion of this new and little-known method to better fit the statistical criteria considered by Morettin & Toloi (2006) regarding the serial autocorrelation structure. Finally, we applied it to data generated by the AR-GARCH model and to two real databases, the same as those used by Chen et al. (2010), to compare the performance of the recurrent SVR with the new criterion of GARCH, ARMA and AR-GARCH models. Máquinas de vetores de suporte Aprendizagem de máquina Modelos lineares (Estatística) Séries temporais
4	Early Warning System para distress bancário no Brasil Barbosa, Jorge Henrique de Frias 30 June 2017 (has links) Tese (doutorado)—Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade e Gestão Pública, Programa de Pós-Graduação em Administração, 2017. / Submitted by Raquel Almeida (raquel.df13@gmail.com) on 2017-10-24T17:50:03Z No. of bitstreams: 1 2017_JorgeHenriquedeFriasBarbosa.pdf: 3875803 bytes, checksum: 2fd1608eb0ac0d76f29b924898b06b59 (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2017-10-31T12:15:52Z (GMT) No. of bitstreams: 1 2017_JorgeHenriquedeFriasBarbosa.pdf: 3875803 bytes, checksum: 2fd1608eb0ac0d76f29b924898b06b59 (MD5) / Made available in DSpace on 2017-10-31T12:15:52Z (GMT). No. of bitstreams: 1 2017_JorgeHenriquedeFriasBarbosa.pdf: 3875803 bytes, checksum: 2fd1608eb0ac0d76f29b924898b06b59 (MD5) Previous issue date: 2017-10-31 / Esta tese é composta por três artigos que cobrem tópicos sobre o tema de early warning system para crises bancárias e distress bancário: uma pesquisa bibliométrica sobre early warning system (EWS) para crises bancárias e distress, um estudo empírico que estima um early warning system para distress de bancos brasileiros com regressão logística e um estudo empírico que constrói um early warning system com técnicas de aprendizagem de máquina supervisionada. O primeiro artigo apresenta um panorama do estado da literatura sobre EWS para crises bancárias e distress bancário por meio de uma revisão bibliométrica da literatura apresentando as principais ideias, principais conceitos, principais relacionamentos com outros tipos de crises, principais métodos utilizados, principais indicadores de crises e de distress. Foi realizada uma pesquisa em nas bases da Scopus e da Web of Science, onde, a partir de critérios de seleção, foram encontrados 124 artigos que foram devidamente classificados e codificados mediante importantes critérios para a área de estudo. Foi apresentado a evolução dos estudos na área, as gerações e tipos de EWS e os principais indicadores micro e macroprudencias apresentados pelos estudos da amostra. Como um resultado das lacunas da literatura na área é proposta uma agenda estruturada, visando guiar novos estudos por meio da apresentação de lacunas com grande potencial para ser explorada e reforçar o estado da arte em EWS. Adicionalmente, os resultados demonstram que mais estudos são necessários em EWS com relação à determinação dos horizontes de tempo para as previsões do modelo, com relação a estudos que tratam da América do Sul, América Central e África. Futuros estudos também devem considerar a possibilidade de utilização de modelos de aprendizagem de máquina, inteligência artificial e métodos computacionais, pois ainda existem poucos estudos e os resultados são promissores. O segundo artigo contribuiu com algumas inovações, como a construção e utilização de uma nova base dados de eventos de distress de bancos brasileiros, incluindo 179 eventos considerados como distress bancário de acordo com a definição de ?, incluindo 8 casos de RAET, 9 casos de intervenção, um caso de PROER, 11 casos de privatizações, 32 casos de incorporação e fusão, 13 casos de transformação em outros tipos de instituições financeiras, 32 caso de transformação de bancos em outros tipos de instituições, 21 casos de cancelamento e 52 casos de liquidação extrajudicial. Foi construído um painel de dados a partir de 54.087 balancetes de 359 bancos, englobando o período de julho de 1994 a novembro de 2016, juntamente com dados do setor bancário brasileiro e dados macroeconômicos. Para tratar do problema de eventos raros. O presente estudo utilizou a abordagem SMOTE (Synthetic Minority Over-sampling Technique) que pode aumentar a performance do modelo em termos da área sob a curva ROC (Area under the Receiver Operating Characteristic curve - AUC), uma técnica que que maximiza a área sob a curva ROC (AUC - area under the curve). Outra contribuição do segundo estudo foia comparação de modelos de acordo com o horizonte de tempo das previsões, característica importante para um EWS. Verificou-se que o modelo com o horizonte de tempo de 6 meses foi o modelo com maior área sob a curva ROC, para os dados da amostra utilizada, considerando-se o período de julho de 1994 até novembro de 2016. No terceiro artigo, foram utilizadas duas técnicas de aprendizagem de máquina supervisionada para construir EWSs: random forest e SVM (support vector machines) que obtiveram resultados superiores ao modelo de regressão logística apresentado no segundo estudo. Ambos os modelos de aprendizagem de máquina superam a regressão logística, em termos de acurácia, área sob a curva AUC (Area Under the Curve –AUC), sensibilidade (valor preditivo positivo) e especificidade (valor preditivo negativo). E o modelo random forest também superou o SVM em termos de acurácia, área sob a curva (AUC), sensibilidade e especificidade. Verificou-se também que os modelos random forest apresentaram melhor qualidade de previsão com as janelas de tempo de 32 e 34 meses, mostrando-se adequados às necessidades das autoridades. / This thesis consistis of three articles covering topics in early warning system (EWS) for bank crises and distress: an empirical study that estimates an early warning system for distress of Brazilian banks with logistic regression and an empirical study that builds an early warning system with techniques Of supervised machine learning. The first article presents an overview of the literature on EWS for bank crises and bank distress through a bibliometric review of the literature presenting the main ideas, main concepts, main relationships with other types of crises, main methods used, main crisis indicators And distress. A survey was carried out in the databases of Scopus and the Web of Science, where, based on selection criteria, 124 articles were found that were duly classified and codified by important criteria for the study area. The evolution of the studies in the area, the generations and types of EWS and the main micro and macroprudential indicators presented by the sample studies were presented. As a result of the literature gaps in the area, a structured agenda is proposed, aimed at guiding new studies through the presentation of gaps with great potential to be explored and to reinforce the state of the art in EWS. In addition, the results demonstrate that more studies are needed in EWS regarding the determination of time horizons for model predictions, in relation to studies dealing with South America, Central America and Africa. Future studies should also consider the possibility of using machine learning models, artificial intelligence and computational methods, as there are still few studies and the results are promising. The article contributed some innovations such as the construction and use of a new database of distress events of Brazilian banks, including 179 events considered as bank distress according to the definition of ?, including 8 cases of RAET (Temporary Special Administration Scheme), 9 cases of intervention, one PROER (The Program of Incentives for the Restructuring and Strengthening of the National Financial System) case, 11 cases of privatization, 32 cases of incorporation and merger, 13 cases of transformation in other types of financial institutions, 32 cases of transformation of banks into other types of institutions, 21 cases of cancellation and 52 cases of extrajudicial liquidation. A data panel was constructed from 54,087 balance sheets of 359 banks, covering the period from July 1994 to November 2016, together with data from the Brazilian banking sector and macroeconomic data. In order to address the problem of rare events, the present study used the Synthetic Minority Over-sampling Technique (SMOTE) approach that can increase the model’s performance in terms of the Area under the Receiver Operating Characteristic curve (AUC), a technique that maximizes the area under the ROC curve (AUC). Another contribution of the second study was the comparison of models according to the time horizon of the forecasts, an important feature for an EWS. It was verified that the model with the time horizon of 6 months was the model with the largest area under the ROC curve, for the data of the sample used, considering the period from July 1994 to November 2016. In the third article, two supervised machine learning techniques were used to construct EWSs: random forest and SVM (support vector machines) that obtained results superior to the logistic regression model presented in the second study. Both models of machine learning outperform logistic regression in terms of accuracy, area under the AUC curve, sensitivity (positive predictive value) and specificity (negative predictive value). And the random forest model also surpassed the SVM in terms of accuracy, area under the curve (AUC), sensitivity and specificity. It was also verified that the random forest models presented better quality of prediction with the forecast time horizons of 32 and 34 months, being adapted to the needs of the authorities. Bancos - finanças - Brasil Crise econômica Máquinas de vetores de suporte
5	Distinguishing long non-coding RNAs from protein coding transcripts based on machine learning techniques Schneider, Hugo Wruck 28 September 2017 (has links) Tese (doutorado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2017. / Submitted by Raquel Almeida (raquel.df13@gmail.com) on 2017-12-18T16:34:15Z No. of bitstreams: 1 2017_HugoWruckSchneider.pdf: 2108041 bytes, checksum: 6be494b560adf8d5114b2439b4b025c0 (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2018-02-20T20:23:11Z (GMT) No. of bitstreams: 1 2017_HugoWruckSchneider.pdf: 2108041 bytes, checksum: 6be494b560adf8d5114b2439b4b025c0 (MD5) / Made available in DSpace on 2018-02-20T20:23:11Z (GMT). No. of bitstreams: 1 2017_HugoWruckSchneider.pdf: 2108041 bytes, checksum: 6be494b560adf8d5114b2439b4b025c0 (MD5) Previous issue date: 2018-02-20 / Dentre as análises que devem ser realizadas nos projetos de sequenciamento, um problema importante é a distinção entre transcritos codificadores de proteinas (PCTs) e RNAs nãocodificadores longos (lncRNAs). Esse trabalho investiga potenciais características dos lncRNAs e propõe dois métodos para distinção dessas duas classes de transcritos (PCTs e lncRNAs). O primeiro método foi proposto com base em máquinas de vetores de suporte (SVM), enquanto o segundo utilizou técnicas de aprendizado semi-supervisionado. O mé- todo utilizando SVM obteve excelentes resultados, quando comparados a outras propostas existentes na literatura. Esse método foi treinado e testado com dados de humanos, camundongos e peixe-zebra, tendo atingido uma acurácia de ≈ 98% com dados de humanos e camundongos, e de ≈ 96% para os dados do peixe-zebra. Ainda, foram criados modelos utilizando várias espécies, que mostraram classificações melhores para outras espécies diferentes daquelas do treinamento, ou seja, mostraram boa capacidade de generalização. Para validar esse método, foram utilizados dados de ratos, porcos e drosófilas, além de dados de RNA-seq de humanos, gorilas e macacos. Essa validação atingiu uma acurácia de mais de 85%, em todos os casos. Por fim, esse método foi capaz de identificar duas sequências dentro do Swiss-Prot que puderam ser reanotadas. O método baseado em aprendizado semi-supervisionado foi treinado e testado com dados de humanos, camundongos, ornitorrincos, galinhas, gambás, orangotangos e rãs, tendo sido utilizadas cinco técnicas de aprendizado semi-supervisionado. A contribuição desse método foi que ele permitiu a redução do tamanho do conjunto de dados classificados, utilizados no treinamento. No melhor caso, somente 2 sequências bem anotadas foram usadas no treinamento, o que, comparado com outras ferramentas disponíveis na literatura, indica um ganho expressivo. A acurácia obtida pelo método nos melhores casos foram de ≈ 95% para dados de humanos e camundongos, ≈ 90% para dados de galinhas, gambás e orangutangos, e ≈ 80% para dados de ornitorrincos e rãs. Dados de RNA-seq foram utilizados para teste, tendo sido obtida acurácia de mais de 95%. Esses dados foram utilizados para treinamento dos modelos de orangotango e de rã, que também apresentaram acurácias excelentes. / Among the analyses that have to be performed in sequencing projects, an important problem to be addressed is the distinction of protein coding transcripts (PCTs) and long non-coding RNAs (lncRNA). This work investigates potential characteristics of the lncRNAs and proposes two methods for distinguishing these two classes of transcripts (PCTs and lncRNAs). The first methods was based on Support Vector Machine (SVM), while the second one used semi-supervised learning techniques. The SVM based method obtained excellent results when compared to other methods in the literature. This method was trained and tested with data from human, mouse and zebrafish, and reached accuracy of ≈ 98% for human and mouse data, and ≈ 96% for zebrafish data. Besides, models with multiple species were created, which improved the classification for species different from those used in the training phase, i.e., these models could also be used in the classification of species different from those that were used in the training phase. To validate this method, data from rat, pig and drosophila, and RNA-seq data from humans, gorillas and macaque were used. This validation reached an accuracy of more than 85% for all the species. Finally, this method was able to identify two sequences within the Swiss-Prot database that were reannotated. The semi-supervised based method was trained and tested with data from human, mouse, platypus, chicken, opossum, orangutan and xenopus, in five semi-supervised learning techniques. The contribution of this method was the reduction of the size of the classified training data set. In the best scenario, only two annotated sequences were used in the training phase, which is an expressive gain when compared to other tools available in the literature. Accuracies obtained by the method in the best cases were ≈ 95% for human and mouse datasets, ≈ 90% for chicken, opossum and orangutan datasets, and ≈ 80% for data platypus and xenopus datasets. RNA-seq data were used for testing, having obtained more than 95% of accuracy. This data was used to train the orangutan and xenopus models, also leading to an excellent accuracy. RNAs não-codificadores Máquinas de vetores de suporte Análise de componentes principais
6	Aquisição e processamento de biosinais de eletromiografia de superfície e eletroencelografia para caracterização de comandos verbais ou intenção de fala mediante seu processamento matemático em pacientes com disartria Sánchez Galego, Juliet January 2016 (has links) Sistemas para assistência de pessoas com sequelas de Acidente Vascular Cerebral (AVC) como, por exemplo, a Disartria apresenta interesse crescente devido ao aumento da parcela da população com esses distúrbios. Este trabalho propõe a aquisição e o processamento dos biosinais de Eletromiografia de Superficie (sEMG) no músculos do rosto ligados ao processo da fala e de Eletroencefalografia (EEG), sincronizados no tempo mediante um arquivo de áudio. Para isso realizaram-se coletas em voluntários saudáveis no Laboratório IEE e com voluntários com Disartria, previamente diagnosticados com AVC, no departamento de Fisioterapia do Hospital de Clínicas de Porto Alegre. O objetivo principal é classificar esses biosinais frente a comandos verbais estabelecidos, mediante o método computacional Support Vector Machine (SVM) para o sinal de sEMG e Naive Bayes (NB) para o sinal de EEG, visando o futuro estudo e classificação do grau de Disartria do paciente. Estes métodos foram comparados com o Linear Discriminant Analysis (LDA), que foi implementado para os sinais de sEMG e EEG. As características extraídas do sinal de sEMG foram: desvio padrão, média aritmética, skewness, kurtosis e RMS; para o sinal de EEG as características extraídas na frequência foram: Mínimo, Máximo, Média e Desvio padrão e Skewness e Kurtosis, no domínio do tempo. Como parte do pré-processamento também foi empregado o filtro espacial Common Spatial Pattern (CSP) de forma a aumentar a atividade discriminativa entre as classes de movimento no sinal de EEG. Foi avaliado através de um Projeto de Experimentos Fatorial, a natureza das coletas, o sujeito, o método computacional, o estado do sujeito e a banda de frequência filtrada para EEG. Os comandos verbais definidos: “Direita”, “Esquerda”, “Para Frente” e “Para Trás”, possibilitaram a identificação de tarefas mentais em sujeitos saudáveis e com Disartria, atingindo-se Accuracy de 77,6% - 80,8%. / Assistive technology for people with Cerebrovascular Accident (CVA) aftereffects, such as Dysarthria, is gaining interest due to the increasing proportion of the population with these disorders. This work proposes the acquisition and processing of Surface Electromyography (sEMG) signal from the speech process face muscles and Electroencephalography (EEG) signal, synchronized in time by an audio file. For that reason assays were carried out with healthy volunteers at IEE Laboratory and with dysarthric volunteers, previously diagnosed with CVA, at the physiotherapy department of the Porto Alegre University Hospital. The main objective is to classify these biosignals in front of verbal commands established, by computational method of Support Vector Machine (SVM) for the sEMG and Naive Bayes (NB) for EEG, regarding the future study and classification of pacient degree of Dysarthria. These methods were compared with Linear Discriminant Analysis (LDA), who was implemented for sEMG and EEG. The extracted features of sEMG signal were: standard deviation, arithmetic mean, skewness, kurtosis and RMS; for EEG signal extracted features in frequency domain were: minimum, maximum, average and standard deviation, skewness and kurtosis, were used for time domain extraction. As part of pre-processing, Common Spatial Pattern (CSP) filter was also employed, in order to increase the discriminating activity between motion classes in the EEG signal. Data were evaluated in a factorial experiment project, with nature of assays, subject, computational method, subject health state and specifically for EEG were evaluated frequency band filtered. Defined verbal commands, "Right", "Left", "Forward" and "Back", allowed the identification of mental tasks in healthy subjects and dysarthric subjects, reaching Accuracy of 77.6% - 80.8%. Eletromiografia Eletroencefalografia Tecnologia assistiva Máquinas de vetores de suporte Electromyography Electroencephalography Assistive technology Bayesian networks Support vector machines
7	Aquisição e processamento de biosinais de eletromiografia de superfície e eletroencelografia para caracterização de comandos verbais ou intenção de fala mediante seu processamento matemático em pacientes com disartria Sánchez Galego, Juliet January 2016 (has links) Sistemas para assistência de pessoas com sequelas de Acidente Vascular Cerebral (AVC) como, por exemplo, a Disartria apresenta interesse crescente devido ao aumento da parcela da população com esses distúrbios. Este trabalho propõe a aquisição e o processamento dos biosinais de Eletromiografia de Superficie (sEMG) no músculos do rosto ligados ao processo da fala e de Eletroencefalografia (EEG), sincronizados no tempo mediante um arquivo de áudio. Para isso realizaram-se coletas em voluntários saudáveis no Laboratório IEE e com voluntários com Disartria, previamente diagnosticados com AVC, no departamento de Fisioterapia do Hospital de Clínicas de Porto Alegre. O objetivo principal é classificar esses biosinais frente a comandos verbais estabelecidos, mediante o método computacional Support Vector Machine (SVM) para o sinal de sEMG e Naive Bayes (NB) para o sinal de EEG, visando o futuro estudo e classificação do grau de Disartria do paciente. Estes métodos foram comparados com o Linear Discriminant Analysis (LDA), que foi implementado para os sinais de sEMG e EEG. As características extraídas do sinal de sEMG foram: desvio padrão, média aritmética, skewness, kurtosis e RMS; para o sinal de EEG as características extraídas na frequência foram: Mínimo, Máximo, Média e Desvio padrão e Skewness e Kurtosis, no domínio do tempo. Como parte do pré-processamento também foi empregado o filtro espacial Common Spatial Pattern (CSP) de forma a aumentar a atividade discriminativa entre as classes de movimento no sinal de EEG. Foi avaliado através de um Projeto de Experimentos Fatorial, a natureza das coletas, o sujeito, o método computacional, o estado do sujeito e a banda de frequência filtrada para EEG. Os comandos verbais definidos: “Direita”, “Esquerda”, “Para Frente” e “Para Trás”, possibilitaram a identificação de tarefas mentais em sujeitos saudáveis e com Disartria, atingindo-se Accuracy de 77,6% - 80,8%. / Assistive technology for people with Cerebrovascular Accident (CVA) aftereffects, such as Dysarthria, is gaining interest due to the increasing proportion of the population with these disorders. This work proposes the acquisition and processing of Surface Electromyography (sEMG) signal from the speech process face muscles and Electroencephalography (EEG) signal, synchronized in time by an audio file. For that reason assays were carried out with healthy volunteers at IEE Laboratory and with dysarthric volunteers, previously diagnosed with CVA, at the physiotherapy department of the Porto Alegre University Hospital. The main objective is to classify these biosignals in front of verbal commands established, by computational method of Support Vector Machine (SVM) for the sEMG and Naive Bayes (NB) for EEG, regarding the future study and classification of pacient degree of Dysarthria. These methods were compared with Linear Discriminant Analysis (LDA), who was implemented for sEMG and EEG. The extracted features of sEMG signal were: standard deviation, arithmetic mean, skewness, kurtosis and RMS; for EEG signal extracted features in frequency domain were: minimum, maximum, average and standard deviation, skewness and kurtosis, were used for time domain extraction. As part of pre-processing, Common Spatial Pattern (CSP) filter was also employed, in order to increase the discriminating activity between motion classes in the EEG signal. Data were evaluated in a factorial experiment project, with nature of assays, subject, computational method, subject health state and specifically for EEG were evaluated frequency band filtered. Defined verbal commands, "Right", "Left", "Forward" and "Back", allowed the identification of mental tasks in healthy subjects and dysarthric subjects, reaching Accuracy of 77.6% - 80.8%. Eletromiografia Eletroencefalografia Tecnologia assistiva Máquinas de vetores de suporte Electromyography Electroencephalography Assistive technology Bayesian networks Support vector machines
8	Aquisição e processamento de biosinais de eletromiografia de superfície e eletroencelografia para caracterização de comandos verbais ou intenção de fala mediante seu processamento matemático em pacientes com disartria Sánchez Galego, Juliet January 2016 (has links) Sistemas para assistência de pessoas com sequelas de Acidente Vascular Cerebral (AVC) como, por exemplo, a Disartria apresenta interesse crescente devido ao aumento da parcela da população com esses distúrbios. Este trabalho propõe a aquisição e o processamento dos biosinais de Eletromiografia de Superficie (sEMG) no músculos do rosto ligados ao processo da fala e de Eletroencefalografia (EEG), sincronizados no tempo mediante um arquivo de áudio. Para isso realizaram-se coletas em voluntários saudáveis no Laboratório IEE e com voluntários com Disartria, previamente diagnosticados com AVC, no departamento de Fisioterapia do Hospital de Clínicas de Porto Alegre. O objetivo principal é classificar esses biosinais frente a comandos verbais estabelecidos, mediante o método computacional Support Vector Machine (SVM) para o sinal de sEMG e Naive Bayes (NB) para o sinal de EEG, visando o futuro estudo e classificação do grau de Disartria do paciente. Estes métodos foram comparados com o Linear Discriminant Analysis (LDA), que foi implementado para os sinais de sEMG e EEG. As características extraídas do sinal de sEMG foram: desvio padrão, média aritmética, skewness, kurtosis e RMS; para o sinal de EEG as características extraídas na frequência foram: Mínimo, Máximo, Média e Desvio padrão e Skewness e Kurtosis, no domínio do tempo. Como parte do pré-processamento também foi empregado o filtro espacial Common Spatial Pattern (CSP) de forma a aumentar a atividade discriminativa entre as classes de movimento no sinal de EEG. Foi avaliado através de um Projeto de Experimentos Fatorial, a natureza das coletas, o sujeito, o método computacional, o estado do sujeito e a banda de frequência filtrada para EEG. Os comandos verbais definidos: “Direita”, “Esquerda”, “Para Frente” e “Para Trás”, possibilitaram a identificação de tarefas mentais em sujeitos saudáveis e com Disartria, atingindo-se Accuracy de 77,6% - 80,8%. / Assistive technology for people with Cerebrovascular Accident (CVA) aftereffects, such as Dysarthria, is gaining interest due to the increasing proportion of the population with these disorders. This work proposes the acquisition and processing of Surface Electromyography (sEMG) signal from the speech process face muscles and Electroencephalography (EEG) signal, synchronized in time by an audio file. For that reason assays were carried out with healthy volunteers at IEE Laboratory and with dysarthric volunteers, previously diagnosed with CVA, at the physiotherapy department of the Porto Alegre University Hospital. The main objective is to classify these biosignals in front of verbal commands established, by computational method of Support Vector Machine (SVM) for the sEMG and Naive Bayes (NB) for EEG, regarding the future study and classification of pacient degree of Dysarthria. These methods were compared with Linear Discriminant Analysis (LDA), who was implemented for sEMG and EEG. The extracted features of sEMG signal were: standard deviation, arithmetic mean, skewness, kurtosis and RMS; for EEG signal extracted features in frequency domain were: minimum, maximum, average and standard deviation, skewness and kurtosis, were used for time domain extraction. As part of pre-processing, Common Spatial Pattern (CSP) filter was also employed, in order to increase the discriminating activity between motion classes in the EEG signal. Data were evaluated in a factorial experiment project, with nature of assays, subject, computational method, subject health state and specifically for EEG were evaluated frequency band filtered. Defined verbal commands, "Right", "Left", "Forward" and "Back", allowed the identification of mental tasks in healthy subjects and dysarthric subjects, reaching Accuracy of 77.6% - 80.8%. Eletromiografia Eletroencefalografia Tecnologia assistiva Máquinas de vetores de suporte Electromyography Electroencephalography Assistive technology Bayesian networks Support vector machines
9	Predição de RNAs não-codificadores no transcriptoma do fungo Paracoccidioides brasiliensis usando aprendizagem de máquina Arrial, Roberto Ternes 04 1900 (has links) Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Biológicas, Departamento de Biologia Celular, 2008. / Submitted by Diogo Trindade Fóis (diogo_fois@hotmail.com) on 2009-10-06T11:45:45Z No. of bitstreams: 1 2008_RobertoTernesArrial.pdf: 1174697 bytes, checksum: deb680a64e956cb71d50d5d028a379c8 (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2009-11-03T17:27:16Z (GMT) No. of bitstreams: 1 2008_RobertoTernesArrial.pdf: 1174697 bytes, checksum: deb680a64e956cb71d50d5d028a379c8 (MD5) / Made available in DSpace on 2009-11-03T17:27:16Z (GMT). No. of bitstreams: 1 2008_RobertoTernesArrial.pdf: 1174697 bytes, checksum: deb680a64e956cb71d50d5d028a379c8 (MD5) Previous issue date: 2008-04 / Paracoccidioides brasiliensis (Pb) é um fungo saprófito e dimórfico de importância clínica, pois seus propágulos, quando inalados por humanos, desencadeiam a doença conhecida como paracoccidioidomicose. No ano de 2005 foi publicado o transcriptoma do Pb, apontando diversos alvos potenciais de drogas, mas ainda assim uma parte significativa dos transcritos seqüenciados não possui proteínas homólogas identificadas. Esse trabalho sugere que alguns desses RNAs possam ser não-codificadores (ncRNAs), uma classe de moléculas biologicamente funcionais que no entanto não codificam para nenhum produto protéico. Para tanto foi feita uma abordagem exclusivamente computacional, utilizando exemplos conhecidos de mRNAs e ncRNAs para treinamento de dois algoritmos de aprendizado de máquina: naive Bayes (nB) e Máquinas de Vetores de Suporte (MVS). Diversos programas descritos na literatura e desenvolvidos localmente foram usados para obter propriedades dos transcritos e de seus produtos protéicos, de forma que os algoritmos de aprendizado de máquina fossem capazes de diferenciar satisfatoriamente um mRNA de um ncRNA. O uso de várias medidas de eficiência mostra que ambos algoritmos, MVS e nB, induziram classificadores que discriminam as duas classes de RNAs de forma muito eficiente, mas também indicam que o MVS possui uma vantagem significativa em relação à sua detecção de ncRNAs. Acurácia média mensurada por validação cruzada de 10 vezes para o MVS foi de 92,4%, e para o nB, 75,3%. Quando usados no transcriptoma de Pb, o MVS e o nB detectam, respectivamente, 970 e 262 ncRNAs, dos quais a maior parte é de transcritos sem anotação e singlets, duas características que apóiam a possibilidade de que esses transcritos sejam realmente ncRNAs. Comparações a programas relacionados mostram que o programa aqui descrito apresenta um ganho em velocidade computacional sem perda de acurácia. Foi desenvolvido nesse trabalho um programa computacional de análise ab initio, designado PORTRAIT, especializado em detecção de ncRNAs em transcriptomas de organismos pouco caracterizados. __________________________________________________________________________________________ ABSTRACT / Paracoccidioides brasiliensis (Pb) is a saprophytic and dimorphic fungus of clinical importance because its propagules, when inhaled by humans, cause the disease known as paracoccidioidomycosis. In the year 2005 the Pb transcriptome was published, pointing out several potential drug targets, but still a significative amount of sequenced transcripts lack identified homologous proteins. This work suggests that these RNAs may be non-coding RNAs (ncRNAs), a class of biologically functional molecules that do not code for any protein product. Aiming this, a strictly computational approach was made, using known examples of mRNAs and ncRNAs for training two machine learning algorithms: naive Bayes (nB) and Support Vector Machines (SVM). Several programs available from literature and locally developed were used to obtain properties from transcripts and its corresponding protein products, in such a way that machine learning algorithms could successfully discriminate between mRNA and ncRNA. Several efficiency measurements show that both algorithms, SVM and nB, induced classifiers able to efficiently discriminate the two classes of RNAs, and also indicate that SVM has a significative advantage regarding ncRNA detection. Mean accuracy as estimated by 10-fold cross-validation procedure was 92.4% for SVM and 75.3% for nB. When used in the Pb transcriptome, SVM and nB detect, respectively, 970 and 262 ncRNAs, of which the majority is composed of singlets and unnanotated transcripts, two characteristics that support the possibility that these transcripts are real ncRNAs. Comparison to related works indicates that the described program offers a computational speed improvement without hindering accuracy. This work describes the design of a computational program for ab initio analysis, named PORTRAIT, specialized in detection of ncRNAs in transcriptomes from poorly characterized organisms. RNAs não-codificadores Aprendizagem de máquina Máquinas de vetores de suporte Paracoccidioides brasiliensis Transcriptoma Genética molecular Fungos Biologia molecular
10	Identifying Kinship Cues from Facial Images VIEIRA, Tiago Figueiredo 08 November 2013 (has links) Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-04-17T13:23:49Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) TESE Tiago Figueiredo Vieira.compressed.pdf: 2116364 bytes, checksum: b3851944ff7105bff9fdcd050d5d4f86 (MD5) / Made available in DSpace on 2015-04-17T13:23:49Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) TESE Tiago Figueiredo Vieira.compressed.pdf: 2116364 bytes, checksum: b3851944ff7105bff9fdcd050d5d4f86 (MD5) Previous issue date: 2013-11-08 / A investigação da face humana é comum em análise de padrões/ processamento de imagens. Abordagens tradicionais são a identificação e a verificação mas muitas outras estão surgindo, como estimativa de idade, análise de similaridade, atratividade e o reconhecimento de parentesco. Apesar deste último possuir diversas possíveis aplicações, poucos trabalhos foram apresentados até então. Esta tese apresenta um algoritmo apto a discriminar entre irmãos e não irmãos, baseado nas imagens das suas faces. Um grande desafio foi lidar com a falta de um benchmark em análise de parentesco e, por esta razão, uma base de imagens de alta qualidade de pares de irmãos foi coletada. Isto é uma contribuição relevante à comunidade científica e foi particularmente útil para evitar possíveis problemas devido a imagens de baixa qualidade e condições não-controladas de aquisição de bases de dados heterogêneas usadas em outros trabalhos. Baseado nessas imagens, vários classificadores foram construídos usando técnicas baseadas na extração de características e holística para investigar quais variáveis são mais eficientes para distinguir parentes. As características foram primeiramente testadas individualmente e então as informações mais significantes da face foram fornecidas a um algoritmo único. O classificador de irmãos superou a performance de humanos que avaliaram a mesma base de dados. Adicionalmente, a boa capacidade de distinção do algorimo foi testado aplicando-o a uma base de dados de baixa qualidade coletada da Internet. O conhecimento obtido da análise de irmãos levou ao desenvolvimento de um algoritmo similar capaz de distinguir pares pai-filho de indivíduos não relacionados. Os resultados obtidos possuem impactos na recuperação e anotação automática de bases de dados, ciência forense, pesquisa genealógica e na busca de familiares perdidos.----------------------------------------------------------------------------------------------- The investigation of human face images is ubiquitous in pattern analysis/ image processing research. Traditional approaches are related to face identification and verification but, several other areas are emerging, like age/ expression estimation, analysis of facial similarity and attractiveness and automatic kinship recognition. Despite the fact that the latter could have applications in fields such as image retrieval and annotation, little work in this area has been presented so far. This thesis presents an algorithm able to discriminate between siblings and unrelated individuals, based on their face images. In this context, a great challenge was to deal with the lack of a benchmark in kinship analysis, and for this reason, a high-quality dataset of images of siblings’ pairs was collected. This is a relevant contribution to the research community and is particularly useful to avoid potential problems due to low quality pictures and uncontrolled imaging conditions of heterogeneous datasets used in previous researches. The database includes frontal, profile, expressionless and smiling faces of siblings pairs. Based on these images, various classifiers were constructed using feature-based and holistic techniques to investigate which data are more effective for discriminating siblings from non-siblings. The features were first tested individually and then the most significant face data were supplied to a unique algorithm. The siblings classifier has been found to outperform human raters on all datasets. Also, the good discrimination capabilities of the algorithm is tested by applying the classifiers to a low quality database of images collected from the Internet in a cross-database experiment. The knowledge acquired from the analysis of siblings fostered a similar algorithm able to discriminating parent-child pairs from unrelated individuals. The results obtained in this thesis have impact in image retrieval and annotation, forensics, genealogical research and finding missing family members. Kinship Verification Support Vector Machines Feature Selection Verificação de Parentesco Máquinas de Vetores de Suporte Seleção de Características

Search results