Algoritmo evolutivo com representação inteira para seleção de características / Evolutionary algorithm using integer representation for feature selection

This work proposes an implementation solution that makes use of integer representation called intEA-MLR instead of binary. The integer representation optimizes the understanding of the data, as the features to be selected are represented by integer values, reducing the size of the chromosome used in the search process. The intEA-MLR in this context is presented as an alternative way of solving high dimensional problems in regression problems. As a case study, three different sets of data are used concerning problems involving determination of properties of interest in samples of 1) Grain Wheat, 2) Medicine tablets and 3) petroleum. Such sets were used in competitions held at the International Diffuse Reflectance Conference (IDRC) (http://cnirs.clubexpress.com/content.aspx?page_id=22&club_ id=409746&module_id=190211), in the years 2008, 2012 and 2014, respectively. The results showed that the proposed solution was able to improve the obtained solutions when compared to the classical implementation that makes use of binary coding, with both more accurate prediction models and with reduced number of features. IntEA-MLR also outperformed the competition winners, reaching 91.17% better than the competition winner for the petroleum data set. In addition, the results also indicated that the computation time required by the intEA-MLR is relatively smaller as more features are available. / Problemas de aprendizado de máquina geralmente envolvem um grande número de características ou variáveis. Nesse contexto, algoritmos de seleção de características tem como desafio determinar um subconjunto reduzido a partir do conjunto original. A principal dificuldade nesta tarefa é o elevado número de soluções disponíveis no espaço de busca. Nesse contexto, algoritmo genético é uma das técnicas mais utilizadas nesse tipo de problema em razão de seu paralelismo implícito na exploração do espaço de busca do problema considerado. Entretanto, geralmente utiliza-se uma representação do tipo biná- ria para codificar as soluções. Neste trabalho é proposto uma solução de implementação que faz uso de representação inteira denominada intEA-MLR em detrimento da binária. A representação inteira otimiza o entendimento dos dados, na medida em que as características a serem selecionadas são determinadas por valores inteiros reduzindo o tamanho do cromossomo utilizado no processo de busca. O intEA-MLR nesse contexto, se apresenta como uma forma alternativa de resolução de problemas de alta dimensionalidade em problemas de regressão. Como estudo de caso, utiliza-se três diferentes conjuntos de dados referente a problemas envolvendo determinação de propriedades de interesse em amostra de 1) Grãos de Trigo, 2) Comprimidos de remédio e 3) Petróleo. Tais conjuntos foram utilizados nas competições realizadas no International Diffuse Reflectance Conference (IDRC) (http://cnirs.clubexpress.com/content.aspx?page_id=22&club_ id=409746&module_id=190211), nos anos de 2008, 2012 e 2014, respectivamente. Os resultados mostraram que a solução proposta foi capaz de aprimorar as soluções obtidas quando comparadas com a implementação clássica que faz uso da codificação binária, tanto com modelos de predição mais acurados quanto com número reduzido de características. intEA-MLR também obteve resultados superiores aos dos vencedores das competições, chegando a obter soluções 91,17% melhores do que o vencedor da competição para o conjunto de dados de petróleo. Adicionalmente, os resultados também indicaram que o tempo de computação requerido pelo intEA-MLR é relativamente menor a medida em que um número maior de características estão disponíveis.

Vocalização de suínos em grupo sob diferentes condições térmicas / Pig vocalization in group under different thermal conditions

Quantificar e qualificar o bem-estar de animais de produção, ainda é um desafio. Em qualquer avaliação de bem-estar, deve-se analisar, principalmente, a ausência de sentimentos negativos fortes, como o sofrimento, e a presença de sentimentos positivos, como o prazer. O objetivo principal dessa pesquisa foi quantificar a vocalização de suínos em grupos sob diferentes condições térmicas. Em termos de objetivos específicos foram avaliar a existência de padrões vocálicos de comunicação entre animais alojados em grupo e extrair as características acústicas dos espectros sonoros das vocalizações relacionando com as diferentes condições do micro-clima da instalação. O experimento foi realizado em uma unidade de experimentação com suínos, junto à University of Illinois (EUA), com ambiente controlado. Quatro grupos de seis leitões foram utilizados para a coleta dos dados. Foram instalados dataloggers para registrar as variáveis ambientais (T, °C e UR, %) e posterior cálculo dos índices de conforto (ITU e Entalpia do ar). Foram instalados microfones do tipo cardióide no centro geométrico de cada baia que abrigava os leitões, para registro das vocalizações. Os microfones foram conectados a um amplificador de sinais, e este a uma placa de captura dos sinais de áudio e vídeo, instalados em um computador. Para as edições dos arquivos de áudio contendo as vocalizações dos leitões, o programa Goldwave® foi utilizado na separação, e aplicação de filtros para a retirada de ruídos. Na sequência, os áudios foram analisados com auxílio do programa Sounds Analysis Pro 2011, onde foram extraídos as características acústicas. A amplitude (dB), frequência fundamental (Hz), frequência média (Hz), frequência de pico (Hz) e entropia foram utilizados para caracterização do espectro sonoro das vocalizações do grupo de leitões nas diferentes condições térmicas. O delineamento do experimento foi em blocos casualizados, com dois tratamentos, e três repetições na semana, sendo executado em duas semanas. Os dados foram amostrados para uma análise do comportamento do banco de dados de vocalização em relação aos tratamentos que foram aplicados. Os dados foram submetidos a uma análise de variância utilizando o proc GLM do SAS. Dentre os parâmetros acústicos analisados, a amplitude (dB), frequência fundamental e entropia. Os tratamentos, condição de conforto e condição de calor, apresentaram diferenças significativas, pelo teste de Tukey (p<0,05). A análise de variância mostrou diferenças no formato da onda para cada condição térmica nos diferentes períodos do dia. É possível quantificar a vocalização em grupos de suínos em diferentes condições térmicas, por intermédio da extração das características acústicas das amostras sonoras. O espectro sonoro foi extraído, indicando possíveis variações do comportamento dos leitões nas diferentes condições térmicas dentro dos períodos do dia. No entanto, a etapa de reconhecimento de padrão, ainda necessita de um banco de dados maior e mais consistente para o reconhecimento do espectro em cada condição térmica, seja por análise das imagens ou pela extração das características acústicas. Dentre as características acústicas analisadas, a amplitude (dB), frequência fundamental (Hz) e entropia das vocalizações em grupo de suínos foram significativas para expressar a condição dos animais quando em diferentes condições térmicas. / To quantify and to qualify animal well-being in livestock farms is still a challenge. To assess animal well-being, it must be analyzed, mainly, the absence of strong negative feelings, like pain, and the presence of positive feelings, like pleasure. The main objective was to quantify vocalization in a group of pigs under different thermal conditions. The specific objectives were to assess the existence of vocal pattern of communication between housing groups of pigs, and get the acoustic characteristics of the sound spectrum from the vocalizations related to the different microclimate conditions. The trial was carried out in a controlled environment experimental unit for pigs, at the University of Illinois (USA). Four groups of six pigs were used in the data collection. Dataloggers were installed to record environmental variables (T, °C and RH, %). These environmental variable were used to calculate two thermal comfort index: Enthalpy and THI. Cardioid microphones were installed to record continuous vocalizations in the geometric center of each pen where the pigs were housing. Microphones were connected to an amplifier, and this was connected to a dvr card installed in a computer to record audio and video information. For doing the sound edition in a pig vocalization database, the Goldwave® software was used to separate, and filter the files excluding background noise. In the sequence, the sounds were analyzed using the software Sounds Analysis Pro 2011, and the acoustic characteristics were extracted. Amplitude (dB), pitch (Hz), mean frequency (Hz), peak frequency (Hz) and entropy were used to characterize the sound spectrum of vocalizations of the groups of piglets in the different thermal conditions. A randomized block design was used, composed by two treatments and three repetitions in a week and executed in two weeks. Data were sampled to analyze the behavior of the databank of vocalization as a relation to the applied treatments. Data were submitted to an analysis of variance using the proc GLM of SAS. Among the studied acoustic parameters, the amplitude (dB), pitch and entropy. The treatments (comfort and heat stress conditions) presented significative differences, through Tukey\'s test (p<0,05). The analysis of variance showed differences to the wave format to each thermal condition in the different periods of the day. The quantification of vocalization of swine in groups under different thermal conditions is possible, using the extraction of acoustic characteristics from the sound samples. The sound spectrum was extracted, which indicated possible alterations in the piglets behavior in the different thermal conditions during the periods of the day. However, the stage of pattern\'s recognition still needs a larger and more consistent database to the recognition of the spectrum in each thermal condition, through image analysis or by the extraction of the acoustic characteristics. Among he analyzed acoustic characteristics, the amplitude (dB), pitch (Hz) and entropy of the vocalizations of groups of swine were significative to express the condition of the animals in different thermal conditions.

Análise de estabilidade de vertentes por meio da utilização dos métodos de Feições Mínimas do relevo e Fator de Segurança / Stability analysis of slopes using the Minimum Feature of relief and Safety Factor methods

Esta pesquisa tem como objetivo sistematizar métodos e informações e auxiliar a análise dos processos de escorregamento do tipo planar (ou translacional) em vertentes associados aos fatores naturais e antrópicos. Os métodos escolhidos foram a delimitação das formas das vertentes em feições mínimas (FM) do relevo e a análise destas formas e das condicionantes de escorregamentos através do cálculo do fator de segurança. Desta maneira, buscou-se um padrão para o comportamento dinâmico das feições. Foi fundamental a utilização de ferramentas de análise de Sistemas de Informações Geográficas (SIG), tendo em vista a execução de cálculos, o desenvolvimento de matrizes de relação e de cartas com a espacialização dos resultados obtidos. Todas as técnicas utilizadas foram descritas neste trabalho. Os resultados revelaram a relação entre as condicionantes dos escorregamentos e as FM, mostrando que fatores como forma da vertente e o fluxo superficial são características importantes na determinação de áreas onde a possibilidade de ocorrência destes eventos seja maior, assim como as variáveis clinográficas e de uso e ocupação da terra / This research aims, through a methodological and informational systematization, to aid the analyses of translational slides in slops associated with natural and anthropic factors which determinate this process. The chosen methods were: the delimitation of slope shape on minimum feature; and the analysis of these features and their landslides conditions by the security factor calculation. Thus, the dynamic behavior of these features is standardized. It was essential to the research the use of the tools of Geographic Information Systems, in order to perform the calculations, to develop the matrix of relationship and the maps of specialization with the results. All techniques were described in this research. The results revealed a relation between the conditions of slides and the minimum features, they demonstrated that factors such as the slope shape and the superficial flow are important to determine where the possibilities of landslides are higher, and also that the slopes and the land-uses variables are relevant.

Lazer, educação informal e traços culturais do migrante brasileiro que permanece temporariamente no Japão - Diálogo de traços étnico-culturais e de lazer entre brasileiros no Japão e japoneses no Brasil / Leisure, Informal education and cultural features as for brazilian migrants who live temporarily In Japan: a dialog between the ethnic/cultural features as well as the leisure activities of brazilians in Japan and those of japanese in Brazil.

Pesquisa sociocultural qualiquantitativa descritiva sobre o lazer, educação informal e traços culturais de brasileiros que permaneceram temporariamente no Japão, em busca de melhores condições de vida. Inicia-se elaborando uma discussão conceitual e teórica do lazer e de suas funções, tempo livre, tempo liberado e desemprego, educação não formal e informal, e faz um recorte de traços culturais. Apresenta aspectos do desemprego no Brasil e na Região Metropolitana de São Paulo, nas décadas de 1980 e 1990, com breve relato circunstancial do movimento migratório de brasileiros para o Japão. Caracteriza o público alvo da amostra, com base na aplicação do questionário, e aborda a história de vida de brasileiros, mediante entrevistas gravadas, em fitas cassetes, com questões abertas padronizadas e estudo bibliográfico. Analisa as informações colhidas, apontando contribuições e impactos socioculturais de brasileiros na vida de japoneses. Esses resultados compõem o fio condutor nutrido com fatos semelhantes vivenciados pelos imigrantes japoneses no Brasil, anteriormente explanados na dissertação de mestrado, elaborando um diálogo sincrônico. Conclui-se que há evidências do imbricamento do lazer e educação informal na formação dos traços culturais dos migrantes brasileiros no Japão, assim como ocorreu com imigrantes japoneses no Brasil. / This research encompasses qualitative and quantitative social-cultural aspects as to leisure, informal education and cultural features of Brazilians who lived temporarily in Japan in search for better living conditions. Firstly, a conceptual and theoretical discussion deals with issues such as leisure and its roles, free time, liberated time and unemployment, non-formal and informal education, and it outlines those Brazilians cultural features. Additionally, it addresses unemployment in Brazil and in the Metropolitan Area of São Paulo in the 80s and 90s, with a short circumstantial report on Brazilians migration to Japan. The target public which comprises the sample is assessed with basis on questionnaires, and their history is approached through interviews consisting of standardized open questions recorded in cassettes, and through a bibliographical study. An analysis of the information gathered is provided, showing the Brazilian contribution to the Japanese life and what its social and cultural impacts on the local people were. Such findings make up this study guideline, furnished with similar situations faced by Japanese immigrants in Brazil formerly reported in a master s thesis*, resulting in a synchronic dialog. It is apparent that both leisure and informal education have wielded considerable influence upon the cultural features of Brazilian migrants in Japan, likewise it happened to Japanese immigrants in Brazil.

Desenvolvimento de biossensores enzimáticos amperométricos para a determinação de compostos de importância clínica / Development of enzymatic amperometric biosensor for the determination of clinical importancy compounds

Este trabalho descreve a preparação e caracterização de eletrodos modificados com azul da Prússia e materiais relacionados e a sua aplicação na construção de biossensores enzimáticos amperométricos para a detecção de oxalato e de glicose. Os materiais utilizados na modificação dos eletrodos foram azul da Prússia e compostos híbridos formados por hexacianoferrato de níquel e polipirrol ou hexacianoferrato de cobre e polipirrol. Os materiais lubridos mostraram-se capazes de mediar na eletroredução de peróxido de hidrogênio, mesmo em eletrólitos contendo Na+, apresentando melhor desempenho analítico quando comparados aos respectivos hexacianoferratos sem a presença do polímero condutor. Estes materiais foram utilizados com êxito na construção de biossensores para oxalato e para glicose, imobilizando as enzimas Oxalato Oxidase e Glicose Oxidase, respectivamente. Também foi estudada a preparação de um biossensor para a detecção de glicose utilizando a técnica de automontagem eletrostática camada por camada. Esta técnica permite otimizar o processo de immobilização da enzima, obtendo excelente desempenho analítico com pouca quantidade de enzima. Finalmente, são apresentadas a síntese, caracterização e aplicação de nanopartículas de azul da Prússia na determinação de peróxido de hidrogênio. Foi possível preparar nanopartículas com um diâmetro médio de 5 nm, as quais foram imobilizadas em eletrodos mediante a técnica de automontagem eletrostática camada por camada, a fim de estudar seu comportamento eletroquímico. / This work describes the preparation and characterization of modified electrodes with Prussian blue and some analogues and their application in the development of amperometric enzymatic biosensors for the detection of glucose and oxalate. The materials used in electrode modification were Prussian blue and hybrid compounds, formed by nickel hexacyanoferrate and polypyrrole or copper hexacyanoferrate and polypyrrole. These materials were able to mediate the hydrogen peroxide electroreduction even in electrolytes containing Na+, showing better analytical performance than the hexacyanyoferrates without polypyrrole. These materials were successfully used to build up oxalate and glucose biosensors. We also have studied the preparation of glucose biosensors using the layer by layer self assemble technique (LBL), which has optimized the enzyme immobilization process, obtaining good analytical performances even loading small amounts of enzyme. FinaIly, we have described the synthesis and characterization of Prussian blue nanoparticles by a sonochemical method. It was possible to synthesize nanoparticles with a diameter around 5 nrn, which were immobilized by the LBL technique, in order to study their electrochemical behavior.

Caracterização do estado nutricional de indivíduos portadores de deficiência motora praticantes de atividade física / Nutritional status characterization of phisically active handicapped individuals

OBJETIVOS: caracterizar o estado nutricional de indivíduos ativos, portadores de deficiência motora. METODOLOGIA: Foram avaliados 68 indivíduos ativos, do sexo masculino, portadores de lesão medular (LM, n= 28), seqüelas de poliomielite (L, n=32) ou amputados (A, n= 8). Foram avaliados: o consumo alimentar (recordatório de 24h e lista de freqüência de alimentos), antropometria (peso, altura, dobras cutâneas), composição corporal por DEXA e por bioimpedância. Quanto aos parâmetros bioquímicos: glicemia de jejum, lipídeos plasmáticos (colesterol total, LDL, HDL e triacilgliceróis), uréia e creatinina, insulina, cortisol e IGF-1 plasmáticos. Os dados dos grupos foram submetidos à análise univariada (ANOVA) e os contrastes significativos ao teste de Tuckey, além da análise multivariada para detecção das correlações entre os parâmetros de avaliação. RESULTADOS: os grupos apresentaram um consumo energético abaixo das predições normais, o que pode ser explicado pela menor necessidade decorrente da diminuição da massa muscular. A distribuição percentual da ingestão de lipídeos apresentou-se elevada, inversamente ao consumo de carboidratos. O IMC mostrou-se um bom indicador da gordura corporal, o DEXA mostrou alta correlação com os dados obtidos por dobras cutâneas e com as predições convencionais de gordura corporal. A densidade óssea do corpo total apresentou normalidade, porém, nos LMe nos P a região das pernas apontou para osteopenia e/ou osteoporose. Os dados bioquímicos apresentaram-se normais. CONCLUSÕES: a atividade física parece ter sido um fator determinante para a normalidade encontrada na maioria dos parâmetros avaliados, embora não tenha sido suficiente para manter a densidade óssea e muscular nas regiões paralisadas. Ficou evidente a necessidade de trabalhos de Educação Nutricional para esses indivíduos. No que diz respeito a parâmetros de densidade óssea, é importante a análise dos diferentes segmentos do corpo. / OBJECTIVES: to characterize the nutricional status of active, handicapped individuals. METHODOLOGY: 68 individuals active, men, with spinal cord injury (SCI) (LM, n = 28), poliomelite sequels (L, n=32) or amputed ( n = 8). They had been evaluated by: food consumption (24h dietary recall and food frequency), anthropometry (weight, height, skinfolders and cicunferences), body composition from DEXA and bioelectrical impedance. About the biochemical parameters: serum fast glucose, serum lipids (total cholesterol, LDL, HDL and triglycerides), serum urea and creatinine, insulin, cortisol and IGF-1. The data had been submitted to the ANOVA and the significant contrasts to the Tuckey test, beyond the multivaried analysis for correlations values between the parameters. RESULTS: the groups had presented an energy consumption below of the normal predictions, what it can be explained by the muscle mass reduction. The distribution of the lipids ingestion was high, inversely to the carbohydrates consumption. The body mass index (BMI) revealed to be a good index of the body fat, the DEXA showed high correlation with the skinfolders and with the body fat predicictions. The total bone density presented normality, however, in the LM and the P the region of the legs pointed osteopenia and/or osteoporose. The biochemical data had been normal. CONCLUSIONS: the physical activity seems to have been a determinative factor for the normality found in the majority of the evaluated parameters, even so it has not been enough to keep the bone and muscle density in the paralyzed regions. The necessity of Nutricional Education was evident for these individuals. About the parameters of bone density, the analysis of the different regions is important .

Uma abordagem para linha de produtos de software científico baseada em ontologia e workflow

Face recognition-based authentication and monitoring in video telecommunication systems

M.Sc. (Computer Science) / A video conference is an interactive meeting between two or more locations, facilitated by simultaneous two-way video and audio transmissions. People in a video conference, also known as participants, join these video conferences for business and recreational purposes. In a typical video conference, we should properly identify and authenticate every participant in the video conference, if information discussed during the video conference is confidential. This prevents unauthorized and unwanted people from being part of the conference and exposing any confidential information during the video conference. Present existing video conferencing systems however, have problems in this area, resulting in some risks. These risks relate precisely to the lack of facilities to properly identify and authenticate participants, making it possible for unwanted/unauthorised participants to join the conference or masquerade as another participant. It is especially a problem, when facilitators or organisers are the only participants that know the authorised participants, or participants allowed in a video conference. In this dissertation, we review the risks that are present in video conferencing, and create a security system, (called BioVid) that mitigates the identification and authentication risks in video conferences. BioVid uses a Speeded-Up Robust Features or SURF-based face recognition approach, to identify and authenticate any participant in a video conference. BioVid continuously monitors the participants to check if masquerading has occurred and when it does detect an unauthorised participant, it informs the Service Provider. The Service Provider can then deal with the problem by either kicking the participant or asking the other participants to vote the unauthorised participant out of the video conference.

State-of-the-art Intrusion Detection: Technology, Challenges, and Evaluation.

Due to the invention of automated hacking tools, Hacking is not a black art anymore. Even script kiddies can launch attacks in few seconds. Therefore, there is a great emphasize on the Security to protect the resources from camouflage. Intrusion Detection System is also one weapon in the security arsenal. It is the process of monitoring and analyzing information sources in order to detect vicious traffic. With its unique capabilities like monitoring, analyzing, detecting and archiving, IDS assists the organizations to combat against threats, to have a snap-shot of the networks, and to conduct Forensic Analysis. Unfortunately there are myriad products inthe market. Selecting a right product at time is difficult. Due to the wide spread rumors and paranoia, in this work I have presented the state-of-the-art IDS technologies, assessed the products, and evaluated. I have also presented some of the novel challenges that IDS products are suffering. This work will be a great help for pursuing IDS technology and to deploy Intrusion Detection Systems in an organization. It also gives in-depth knowledge of the present IDS challenges.

Modélisation non-supervisée de signaux sociaux / Unsupervised modelisation of social signals

Le but de cette thèse est de proposer des méthodes d'étude et des modèles pour l'analyse des signaux sociaux dans un contexte d'interaction en exploitant à la fois des techniques issues du traitement du signal et de la reconnaissance des formes.Tout d'abord, une méthode non supervisée permettant de mesurer l'imitation entre deux partenaires en termes de délai et de degré est proposée en étudiant uniquement des données gestuelles. Dans un premier temps, des points d'intérêts spatio-temporels sont détectés afin de sélectionner les régions les plus importantes des vidéos. Ils sont ensuite décrits à l'aide d'histogrammes pour permettre la construction de modèles sac-de-mots dans lesquels l'information spatiale est réintroduite. Le degré d'imitation et le délai entre les partenaires sont alors estimés de manière continue grâce à une corrélation-croisée entre les deux modèles sac-de-mots.La deuxième partie de cette thèse porte sur l'extraction automatique d'indices permettant de caractériser des interactions de groupe. Après avoir regroupé tous les indices couramment employés dans la littérature, nous avons proposé l'utilisation d'une factorisation en matrice non négative. En plus d'extraire les indices les plus pertinents, celle-ci a permis de regrouper automatiquement et de manière non supervisée des meetings en 3 classes correspondant aux trois types de leadership tels que définis par les psychologues.Enfin, la dernière partie se focalise sur l'extraction non supervisée d'indices permettant de caractériser des groupes. La pertinence de ces indices, par rapport à des indices ad-hoc provenant de l'état de l'art, est ensuite validée dans une tâche de reconnaissance des rôles. / In a social interaction, we adapt our behavior to our interlocutors. Studying and understanding the underlying mecanisms of this adaptation is the center of Social Signal Processing. The goal of this thesis is to propose methods of study and models for the analysis of social signals in the context of interaction, by exploiting both social processing and pattern recognition techniques. First, an unsupervised method allowing the measurement of imitation between two partners in terms of delay and degree is proposed, only using gestual data. Spatio-temporal interest point are first detected in order to select the most important regions of videos. Then they are described by histograms in order to construct bag-of-words models in which spatial information is reintroduced. Imitation degree and delay between partners are estimated in a continuous way thanks to cross-correlation between the two bag-of-words models. The second part of this thesis focus on the automatic extraction of features permitting to characterizing group interactions. After regrouping all features commonly used in literature, we proposed the utilization of non-negative factorization. More than only extracting the most pertinent features, it also allowed to automatically regroup, and in an unsupervised manner, meetings in three classes corresponding to three types of leadership defined by psychologists. Finally, the last part focus on unsupervised extraction of features permitting to characterize groups. The relevance of these features, compared to ad-hoc features from state of the art, is then validated in a role recognition task.

