Spelling suggestions: "subject:"multidimensional""
31 |
Técnicas de projeção para identificação de grupos e comparação de dados multidimensionais usando diferentes medidas de similaridade / Projection techniques for group identification and multidimensional data comparison by using different similarity measuresPaulo Joia Filho 14 October 2015 (has links)
Técnicas de projeção desempenham papel importante na análise e exploração de dados multidimensionais, já que permitem visualizar informações muitas vezes ocultas na alta dimensão. Esta tese explora o potencial destas técnicas para resolver problemas relacionados à: 1) identificação de agrupamentos e 2) busca por similaridade em dados multidimensionais. Para identificação de agrupamentos foi desenvolvida uma técnica de projeção local e interativa que, além de projetar dados com ótima preservação de distâncias, permite que o usuário modifique o layout da projeção, agrupando um número reduzido de amostras representativas no espaço visual, de acordo com suas características. Os mapeamentos produzidos tendem a seguir o layout das amostras organizadas pelo usuário, facilitando a organização dos dados e identificação de agrupamentos. Contudo, nem sempre é possível selecionar ou agrupar amostras com base em suas características visuais de forma confiável, principalmente quando os dados não são rotulados. Para estas situações, um novo método para identificação de agrupamentos baseado em projeção foi proposto, o qual opera no espaço visual, garantindo que os grupos obtidos não fiquem fragmentados durante a visualização. Além disso, é orientado por um mecanismo de amostragem determinístico, apto a identificar instâncias que representam bem o conjunto de dados como um todo e capaz de operar mesmo em conjuntos de dados desbalanceados. Para o segundo problema: busca por similaridade em dados multidimensionais, uma família de métricas baseada em classes foi construída para projetar os dados, com o objetivo de minimizar a dissimilaridade entre pares de objetos pertencentes à mesma classe e, ao mesmo tempo, maximizá-la para objetos pertencentes a classes distintas. As métricas classes-específicas são avaliadas no contexto de recuperação de imagens com base em conteúdo. Com o intuito de aumentar a precisão da família de métricas classes-específicas, outra técnica foi desenvolvida, a qual emprega a teoria dos conjuntos fuzzy para estimar um valor de incerteza que é transferido para a métrica, aumentando sua precisão. Os resultados confirmam a efetividade das técnicas desenvolvidas, as quais representam significativa contribuição na tarefa de identificação de grupos e busca por similaridade em dados multidimensionais. / Projection techniques play an important role in multidimensional data analysis and exploration, since they allow to visualize information frequently hidden in high-dimensional spaces. This thesis explores the potential of those techniques to solve problems related to: 1) clustering and 2) similarity search in multidimensional data. For clustering data, a local and interactive projection technique capable of projecting data with effective preservation of distances was developed. This one allows the user to manipulate a reduced number of representative samples in the visual space so as to better organize them. The final mappings tend to follow the layout of the samples organized by the user, therefore, the user can interactively steer the projection. This makes it easy to organize and group large data sets. However, it is not always possible to select or group samples visually, in a reliable manner, mainly when handling unlabeled data. For these cases, a new clustering method based on multidimensional projection was proposed, which operates in the visual space, ensuring that clusters are not fragmented during the visualization. Moreover, it is driven by a deterministic sampling mechanism, able to identify instances that are good representatives for the whole data set. The proposed method is versatile and robust when dealing with unbalanced data sets. For the second problem: similarity search in multidimensional data, we build a family of class-specific metrics to project data. Such metrics were tailored to minimize the dissimilarity measure among objects from the same class and, simultaneously to maximize the dissimilarity among objects in distinct classes. The class-specific metrics are assessed in the context of content-based image retrieval. With the aim of increasing the precision of the class-specific metrics, another technique was developed. This one, uses the fuzzy set theory to estimate a degree of uncertainty, which is embedded in the metric, increasing its precision. The results confirm the effectiveness of the developed techniques, which represent significant contributions for clustering and similarity search in multidimensional data.
|
32 |
Incompatibilidade cinemática, imersão de domínios e modelagem constitutiva de multiescala : nexo com a modelagem do sistema cardiovascularPablo Javier Blanco 05 June 2008 (has links)
O objetivo do presente trabalho é estabelecer bases teóricas bem fundadas, dentro do contexto variacional, a fim de dar unificação a diversos conceitos que surgem nas seguintes áreas: (i) a modelagem empregando modelos cinematicamente incompatíveis, (ii) a modelagem da interação fluido-estrutura usando métodos de domínios imersos e (iii) a modelagem constitutiva de materiais por meio de técnicas de multiescala. A motivação para abordar cada uma destas problemáticas, e o ponto em comum entre elas, é a modelagem do sistema cardiovascular humano. Portanto, a tese está dividida em três partes.
Em primeiro lugar, estabelecem-se as bases variacionais para abordar de forma sistemática a formulação do problema de acoplamento de modelos que possuem cinemáticas incompatíveis. Esta maneira de tratar o problema permite estender os conceitos de forma direta para lidar com o acoplamento de modelos de diferente dimensão. Logo, estes conceitos são aplicados em duas situações, no acoplamento de modelos estruturais com diferentes cinemáticas subjacentes e, principalmente, no acoplamento de modelos de fluidodinâmica de diferente dimensão visando a modelagem do escoamento do sangue no sistema cardiovascular humano. Diversos exemplos e situações são contemplados neste último caso.
Em segundo lugar, trata-se o problema de interação fluido-estrutura empregando idéias de imersão de domínios. Sempre dentro de um marco variacional claro e construtivo, colocam-se os princípios variacionais que governam a interação de um fluido com sólidos de forma arbitrária e com sólidos que podem ser caracterizados como estruturas delgadas. Assim, por um lado desenvolve-se o denominado método de domínios imersos que generaliza o método de elementos finitos imersos e o método de domínios fictícios. Por outro lado, constrói-se o método de cascas imersas que generaliza o conhecido método de contornos imersos. Apresentam-se também diversos exemplos numéricos de interação entre um fluido e corpos rígidos.
Em terceiro e último lugar, trabalha-se com a modelagem constitutiva empregando técnicas de multiescala, novamente empregando o ferramental variacional. Aqui revisita-se a base teórica existente e realiza-se uma extensão das idéias usando princípios variacionais duais. Além disso, fornecem-se diversas implementações computacionais, as quais são usadas para apresentar dois exemplos, o primeiro na modelagem de materiais porosos e o segundo na modelagem do tecido biológico encontrado na conformação da parede arterial.
Em todos os casos, o objetivo não é só prover uma forma final para a formulação de um problema, mas também desvendar o processo de construção que há por trás dos modelos, mostrando passo a passo as considerações utilizadas assim como as conseqüências de tais hipóteses. Com isto procura-se obter um ganho no entendimento dos conceitos teóricos envolvidos, assim como uma maior facilidade na aplicação destas idéias a novas situações.
|
33 |
A aptidão motora do idoso relacionada a fatores multidimensionais de saúde em diferentes contextos / The motor fitness of elderly multidimensional factors related to health in different contextsWeiss, Silvio Luiz Indrusiak 18 March 2013 (has links)
Made available in DSpace on 2016-12-08T15:59:04Z (GMT). No. of bitstreams: 1
TESE SILVIO WEISS.pdf: 1948768 bytes, checksum: 639c23896ad219f4f5387f6cfbcf75fc (MD5)
Previous issue date: 2013-03-18 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / This research evaluated the motor fitness multidimensional factors associated with the health of the elderly in different contexts sociodemographic and attending promotional programs and rehabilitation of health. Descriptive research, was characterized by a cross-sectional comparison between groups, development. Participated elderly over age 60, including any kind living in Florianópolis. The sample was non-probabilistic convenience (intentional), composed of 70 elderly, divided into two groups, one consisting of 35 people from a cardiopulmonary rehabilitation program and metabolic and another for 35 elderly residents in the metropolitan area of Florianópolis. Was used EMTI (Motor Scale for Third Age), and the Questionnaire BOAS. Sheet for information on risk factors and physical activity. Data collection was extended for a total period of 7 months. The average age of the elderly group Cardiac Rehabilitation (GRC) was 70.8 (σ = 6.8) years and the Reference Group for the Elderly (GIR) of 68.1 (σ = 5.9) years, with the vast majority of GRC (71.3%) with at least 2 risk factors, the most common being hypertension (54.2%) and heart disease (42.8%). In GIR, 60% reported having only one risk factor (23%). 100% of GRC reported physical activity, while in GIR 65.8% are inactive. The elderly participants PRCM indicated greater satisfaction with health services and adherence to daily life activities. The motor fitness of the GIR was higher than the GRC in all areas of motor function in some cases as AM2 and AM4 with significant differences (p = 0.041 and p = 0.00009). The comparison between GRC/GIR was X² = 13.32 with a significant difference between groups (p =0.02). Almost half of elderly GRC (48.6%) were classified as Bottom (I) or Very Low (MI), while elderly GIR were classified as normal (80%), Low (11.4%), Middle ( 54.3%) and high (14.3%). It has been shown that the smaller amount of ingested drugs is related to better fitness motor. Also confirmed the trend of men having better motor fitness women, despite the disadvantage in relation to other health factors. The general motor ability (p = 0.006), fine motor (p = 0.051), gross motor control (p = 0.005) and body image (p = 0.038) was higher than the elderly labor, as well as other results of motor fitness and factors health. Significant difference in overall motor fitness (p = 0.039) and balance (p = 0.02) of the elderly with and without self-reported weakness, for the elderly without weakness. The study concluded that no direct relationship between motor fitness better the various multidimensional factors of health, indicating that this relationship may represent better health, less morbidity and intake of medicines, among others fatores.O study also concluded about the clear benefits the PRCM gives patients in stages III and IV of rehabilitation, for recovery of health, improved self-esteem, change in lifestyle and social integration. / Esta pesquisa avaliou a aptidão motora associada aos fatores multidimensionais da saúde de idosos em diferentes contextos sociodemográficos e que frequentam programas de promoção e reabilitação de saúde. De natureza descritiva, foi caracterizado por um delineamento transversal comparativo entre grupos, de desenvolvimento. Participaram idosos com idade acima de 60, inclusive, de qualquer gênero, residentes na Grande Florianópolis. A amostra foi do tipo não-probabilística por conveniência (intencional), composta por 70 idosos, subdivididos em 2 grupos, um composto por 35 idosos de um programa de reabilitação cardiopulmonar e metabólica e o outro por 35 idosos residentes na Região Metropolitana de Florianópolis. Foi utilizada a EMTI (Escala Motora para Terceira Idade), o Questionário BOAS e a Ficha para informações sobre fatores de risco e atividade física. A coleta de dados estendeu-se por um período total de 7 meses. A idade média dos idosos do Grupo de Reabilitação Cardíaca (GRC) foi de 70,8 (σ=6,8) anos e do Grupo de Idosos de Referência (GIR) de 68,1 (σ=5,9) anos, com a grande maioria do GRC (71,3%) com no mínimo 2 dos fatores de risco, sendo os mais comuns a hipertensão arterial (54,2%) e a doença cardíaca (42,8%). No GIR, 60% informou possuir apenas um fator de risco (23%). 100% do GRC declararam praticar atividade física, enquanto no GIR 65,8% são inativos. Os idosos participantes do PRCM indicaram maior satisfação com serviços de saúde e adesão às atividades de vida diária. A aptidão motora do GIR foi superior a do GRC em todas as áreas da motricidade, em alguns casos como AM2 e AM4 com diferenças significativas (p=0,041 e p=0,00009). A comparação entre GRC/GIR, foi X²=13,32 com uma diferença significativa entre os grupos (p=0,02). Quase a metade dos idosos do GRC (48,6%) foi classificada como Inferior (I) ou Muito Inferior (MI), enquanto idosos do GIR foram classificados como Normal (80%), Baixo (11,4%), Médio (54,3%) e Alto (14,3%). Demonstrou-se que a quantidade menor de medicamentos ingeridos, está relacionada com a melhor aptidão motora. Também confirmou-se a tendência dos homens apresentarem melhor aptidão motora que as mulheres, apesar da desvantagem em relação a outros fatores de saúde. A aptidão motora geral (p=0.006), motricidade fina (p=0,051), motricidade global (p=0,005) e o esquema corporal (p=0,038) dos idosos laborais foi superior, bem como as outros resultados da aptidão motora e fatores de saúde. Houve diferença significativa na aptidão motora geral (p=0,039) e no equilíbrio (p=0,02) dos idosos com e sem fraqueza autorreferida, a favor dos idosos sem fraqueza. O estudo concluiu, que há relação direta entre uma aptidão motora melhor os diversos fatores multidimensionais de saúde, indicando que essa relação pode representar melhores condições de saúde, menos morbidades e ingestão de remédios, entre outros fatores.O estudo também concluiu acerca dos benefícios inequívocos que o PRCM proporciona aos pacientes nas fases III e IV da reabilitação, em relação recuperação da saúde, melhora da autoestima, mudança no estilo de vida e integração social.
|
34 |
Interfaces colaborativas em comunicação e educação ambiental / -Sandra Pereira Falcão 26 March 2018 (has links)
Análise de trânsitos discursivos multidimensionais (CITELLI, 2012) relacionados à \"ecocrise\", em busca de encaminhamentos práticos e epistêmicos para promover reflexão e estímulo à proatividade socioambiental cidadã a partir do eixo Comunicação-Educação. Entre os objetivos específicos do estudo, do qual participaram 514 sujeitos de pesquisa (distribuídos em 12 grupos heterogêneos), incluem-se: estudar possibilidades de preenchimento de falhas na comunicação vinculada ao cenário atual de múltiplos agravantes ao meio ambiente e envolver diferentes grupos da sociedade civil na pesquisa acadêmica, verificando oportunidades de contato e estabelecendo pontes participativas entre universidade e coletividade. A abordagem teórica multirreferencial associada a um conjunto de expedientes variados para captação de dados de campo configuram o método estabelecido para a investigação, de natureza quali/quantitativa. Assim, a observação e análise de aportes em circulação midiática, de interfaces dialógicas físicas e virtuais, bem como a oferta de palestras, minicursos, realização de entrevistas e dinâmicas, aplicação de questionários virtuais e presenciais perfazem uma combinação de técnicas (LOPES, 2005; PONTUSCHKA, 2011) cuja intenção foi recolher fluxos discursivos socioambientais de diferentes dimensões/direções, por meio dos quais verificamos aspectos medulares da comunicação socioambiental contemporânea. Entre os principais resultados, destacam-se: a) percepções díspares quanto à comunicação ambiental em rede, sugerindo que variáveis como faixa etária, interesses, velocidade de contato, tipo de páginas implicam (in)eficácia das interações digitais voltadas à temática ambiental; b) percepções uníssonas quanto ao papel da escola básica em favor do compartilhamento de conteúdos educomunicativos socioambientais na perspectiva do território; c) persistência da incomunicação cidadão-poder público (e vice-versa) no tangente a assuntos socioambientais urbanos; d) ratificação da percepção coletiva de que a comunicação ambiental a circular hoje nos espaços pesquisados está mais próxima de informação e não de comunicação propriamente dita (capaz de sensibilizar para engajamento concreto); e) confirmação de preferência majoritária entre os respondentes por atividades ecopedagógicas que envolvam deslocamento pelo bairro/pela cidade, acopladas ao emprego de meios para produção de tecnoimagens -- preferencialmente estáticas; f) observação de que circuitos colaborativos de informação, comunicação e ação socioambiental podem ser proficientes se conjugada reelaboração de conteúdos científicos (teóricos e práticos, incluindo resultados de campo) a aportes midiáticos para apresentação/discussão presencial dos trânsitos discursivos recolhidos e recombinados; g) observação de que o estudo do discurso coletivo socioambiental proporcionado pela verificação e análise de trânsitos discursivos multidimensionais evidenciou-se como fresta epistêmica e estratégia metodológica viável para: g1) incremento da ação socioambiental proativa entre habitantes de áreas urbanas ambientalmente prejudicadas e g2) planejamento multi-institucional dos processos pesquisa-ensino correlacionados ao binômio comunicação-educação ambiental em tempo de progressivo agravo ecológico. Nossa investigação aponta, entretanto, para a urgência em amplificar contato institucional da universidade com escolas de ensino básico (públicas e privadas), instituições religiosas, instâncias de governo e instituições outras, a fim de desenvolver projetos territorializados de comunicação e educação ambiental integrados ao ensino formal, não formal e informal. Tal movimento vem ao encontro da necessidade de identificar novos mecanismos discursivos, comportamentais, institucionais e epistêmicos aptos a reduzir a distância entre as políticas públicas e a participação dos cidadãos nos processos decisórios ligados à qualidade da vida citadina. / Analysis of multidimensional discursive transits (CITELLI, 2012) related to \"ecocrisis\", in search of practical and epistemic referrals to promote reflection and stimulation of citizen socio-environmental proactivity from the Communication-Education axis. Some of the specific objectives of the study, which involved 514 research subjects (distributed into 12 heterogeneous groups), are: studying possibilities of filling in communication gaps linked to the current scenario of multiple aggravating factors to the environment and involving different groups of civil society in academic research, verifying opportunities for contact and establishing participatory bridges between university and community. The established qualitative/ quantitative research method consists of the multireferential approach coupled with a set of varied tactics for field data collection. Thus, the observation and analysis of contributions in media circulation, of physical and virtual dialogic interfaces, as well as the offer of lectures, mini-courses, interviewing and dynamics, virtual and face-to-face questionnaires constitute a combination of techniques (LOPES, 2005; PONTUSCHKA, 2011) whose intention was to collect socio-environmental discursive flows from different dimensions/directions, through which we verify the core aspects of contemporary socio-environmental communication. Among the main findings: a) disparate views regarding environmental network communication, suggesting that variables such as age range, interests, speed of contact, type of pages influence in the (in)effectiveness of the digital interactions focused on the environmental theme; b) unified perceptions about the role of the middle and high school in favor of the sharing of socio-environmental educational contents in the perspective of the territory; c) persistence of the incommunication citizen-public power (and vice versa) when it comes to urban socio-environmental issues; d) ratification of the collective perception that the available environmental communication nowadays in the researched places is closer to information and not to communication itself (which is capable of raising awareness for concrete engagement); e) confirmation of majority preference among respondents for ecopedagogical activities involving walking around the neighborhood / city, together with the use of means to produce techno-images -- preferably static ones; f) observing that collaborative circuits of information, communication and socioenvironmental action can be proficient by combining re-elaboration of scientific contents (theoretical and practical, including field results) to media contributions used to face-to-face presentations/discussions of collected and recombined discursive transits; g) observing that the study of the socio-environmental collective discourse provided by the verification and analysis of multidimensional discursive transits was evidenced as an epistemic gap and viable methodological strategy for: g1) increasing of proactive socio-environmental action among inhabitants of environmentally impaired urban areas and g2) multi-institutional planning of the research-teaching processes correlated to the binomial communication-environmental education in a time of progressive ecological damage. Our research points, however, to the urgency of amplifying the university\'s institutional contact with public and private elementary, middle and high schools, religious institutions, government agencies and other institutions, in order to develop territorial communication and environmental education projects integrated into formal, non-formal and informal teaching. Such a movement meets the need to identify new discursive, behavioral, institutional and epistemic mechanisms capable of reducing the gap between public policies and citizen participation in decision-making processes linked to the quality of city life.
|
35 |
Visualização de dados multidimensionais referenciados utilizando projeções multidimensionais e animação / Referenced multidimensional data visualization using multidimensional projections and animationTácito Trindade de Araújo Tiburtino Neves 22 August 2011 (has links)
Ferramentas e técnicas de visualização promovem uma análise de dados mais efetiva pelo fato de explorar a capacidade humana na percepção de padrões, principalmente em representações gráficas. Muitos fenômenos são associados a algum tipo de referência, temporal ou geográfica, que pode oferecer informação importante quando são submetidos a processos de análise. Este trabalho aborda representações visuais de dados geradas por técnicas de projeção multidimensional, e propõe uma estratégia para o tratamento diferenciado das referências temporais ou geográficas presentes em conjuntos de dados, no processo de gerar uma projeção multidimensional. Foi proposta e implementada uma variação da técnica Least Square Projection (LSP) que evidencia a informação das referências e permite ao usuário interagir com os mapas visuais gerados, bem como diversas funcionalidades que auxiliam no processo de análise exploratória. A nova abordagem é ilustrada por meio de estudos de caso envolvendo bases de dados temporais e com referências geográficas, em que foi possível observar o comportamento global dos elementos, bem como comportamentos de elementos ou grupos de elementos de interesse. Limitações da estratégia proposta também são discutidas / Visualization tools and techniques promote more effective data analysis by exploiting the human visual perception capabilities in detecting patterns in graphical representations. Many phenomena generate data that include temporal or geographical references, which are likely to provide important information in data analysis procedures. This work addresses data visualizations generated with multidimensional projections, proposing a strategy to handle temporal and geographical references present in multidimensional data sets, when generating multidimensional projections. The Least Squares Projection (LSP) technique was extended to explicitly handle the reference information and represent it in the visual maps, and a set of supporting analysis functions have been implemented. The proposed approach is illustrated through case studies on multidimensional data sets, in which it was possible to observe the global behavior of the elements, as well as individual behavior of elements or groups of elements of interest
|
36 |
Desenvolvimento Sistêmico, equidade e interdependência: a busca por um modelo conceitual de gestão do equilíbrio das relações entre agentes econômicos regionais / Systemic Development, Equity and Interdependency: The Search for a Conceptual Model of the Regional Economic Agents\' Relationships Balance ManagementGanzert, Christian Carvalho 15 October 2012 (has links)
A busca por um modelo conceitual de gestão do equilíbrio em arranjos produtivos é inicialmente justificada pela ausência de metodologias realmente alinhadas aos preceitos sistêmicos de compreensão da realidade. A pesquisa visou à obtenção de um modelo conceitual de análise que indicasse as características que denotariam o equilíbrio entre agentes e manutenção da estrutura de relações de um determinado arranjo econômico de qualquer ordem. Para tal, utilizou-se de recursos da Social Network Analysis e da Teoria dos Jogos, orientados sob uma supra-metodologia de pesquisa derivada da SSM. O resultado final foi a obtenção de um modelo conceitual de gestão do equilíbrio entre agentes econômicos de escopo regional, baseado na análise das características de equilíbrio entre agentes e comportamento da estrutura de relações de um determinado arranjo econômico de qualquer ordem, pautando-se pela obtenção das medidas de relevância interna ponderadas, sendo o indicador de centralidade ponderada de betweenness utilizado para isso, e medidas que indicam o nível de estabilidade dos relacionamentos que compõem a estrutura da rede. Entretanto, para considerar esse modelo realmente aderente às premissas do pensamento sistêmico, foi necessário abstrair que as redes são formadas por múltiplas camadas de relacionamentos de várias naturezas, ou seja, são redes multidimensionais. Para tal, foi necessária a adaptação do ferramental de aferição dos indicadores descritos para a realidade de convergência de múltiplas redes. Nesse intento, foi preciso considerar que cada agente integrante possui pontos de vista diferenciados, ainda que isso possa ser relativizado para efeitos de simulação. Por fim, alinharam-se os indicadores de desvio de relevância interna e estabilidade de rede multidimensional para uma condição que expressasse, em termos relativos a quadrantes, cada uma das típicas possibilidades situacionais da rede, nesta tese enunciada como Classificação Conceitual de Estado de Rede Multidimensional. / The search for a conceptual model of the regional economic agents\' relationships balance management is initially justified by the lack of methodologies that are really aligned to the Systems Thinking premises to comprehend the reality. The research aimed to obtaining a conceptual model that could indicate the characteristics which enable the understanding of the equilibrium between agents and maintenance of the relationships structure for a determined economic arrangement of any order. For that, it were used tools derived from the Social Networks Analysis and the Games Theory, oriented by a derivation of the Soft Systems Methodology as a supra methodology of research. The final result was the creation of a conceptual model which enables the management of the economic agents\' balance in a given economic network, reaching the objective of the research. It was possible by obtaining weighted measures of relevance, considering the betweenness of weighted centrality, and measures that indicate the level of stability of the relationships that make up the network structure. It was also necessary to abstract networks that are formed by multiple layers of varied natures\' relationships seeking to make this model really adhering to the assumptions of systemic thinking. It was equally necessary to adapt the tools for measuring the indicators described for the reality of the converged multiple networks. Finally, this dissertation enunciates the Conceptual Classification of the Multidimensional Networks Status.
|
37 |
Um estudo sobre o papel de medidas de similaridade em visualização de coleções de documentos / A study on the role of similarity measures in visual text analyticsSalazar, Frizzi Alejandra San Roman 27 September 2012 (has links)
Técnicas de visualização de informação, tais como as que utilizam posicionamento de pontos baseado na similaridade do conteúdo, são utilizadas para criar representações visuais de dados que evidenciem certos padrões. Essas técnicas são sensíveis à qualidade dos dados, a qual, por sua vez, depende de uma etapa de pré-processamento muito influente. Esta etapa envolve a limpeza do texto e, em alguns casos, a detecção de termos e seus pesos, bem como a definição de uma função de (dis)similaridade. Poucos são os estudos realizados sobre como esses cálculos de (dis)similaridade afetam a qualidade das representações visuais geradas para dados textuais. Este trabalho apresenta um estudo sobre o papel das diferentes medidas de (dis)similaridade entre pares de textos na geração de mapas visuais. Nos concentramos principalmente em dois tipos de funções de distância, aquelas computadas a partir da representação vetorial do texto (Vector Space Model (VSM)) e em medidas de comparação direta de strings textuais. Comparamos o efeito na geração de mapas visuais com técnicas de posicionamento de pontos, utilizando as duas abordagens. Para isso, foram utilizadas medidas objetivas para comparar a qualidade visual dos mapas, tais como Neighborhood Hit (NH) e Coeficiente de Silhueta (CS). Descobrimos que ambas as abordagens têm pontos a favor, mas de forma geral, o VSM apresentou melhores resultados quanto à discriminação de classes. Porém, a VSM convencional não é incremental, ou seja, novas adições à coleção forçam o recálculo do espaço de dados e das dissimilaridades anteriormente computadas. Nesse sentido, um novo modelo incremental baseado no VSM (Incremental Vector Space Model (iVSM)) foi considerado em nossos estudos comparativos. O iVSM apresentou os melhores resultados quantitativos e qualitativos em diversas configurações testadas. Os resultados da avaliação são apresentados e recomendações sobre a aplicação de diferentes medidas de similaridade de texto em tarefas de análise visual, são oferecidas / Information visualization techniques, such as similarity based point placement, are used for generating of visual data representation that evidence some patterns. These techniques are sensitive to data quality, which depends of a very influential preprocessing step. This step involves cleaning the text and in some cases, detecting terms and their weights, as well as definiting a (dis)similarity function. There are few studies on how these (dis)similarity calculations aect the quality of visual representations for textual data. This work presents a study on the role of the various (dis)similarity measures in generating visual maps. We focus primarily on two types of distance functions, those based on vector representations of the text (Vector Space Model (VSM)) and measures obtained from direct comparison of text strings, comparing the effect on the visual maps obtained with point placement techniques with the two approaches. For this, objective measures were employed to compare the visual quality of the generated maps, such as the Neighborhood Hit and Silhouette Coefficient. We found that both approaches have strengths, but in general, the VSM showed better results as far as class discrimination is concerned. However, the conventional VSM is not incremental, i.e., new additions to the collection force the recalculation of the data space and dissimilarities previously computed. Thus, a new model based on incremental VSM (Incremental Vector Space Model (iVSM)) has been also considered in our comparative studies. iVSM showed the best quantitative and qualitative results in several of the configurations considered. The evaluation results are presented and recommendations on the application of different similarity measures for text analysis tasks visually are provided
|
38 |
Modelos multidimensionais da TRI com distribuições assimétricas para os traços latentes / Multidimensional IRT models with skew distributions for latent traits.Gilberto da Silva Matos 15 December 2008 (has links)
A falta de alternativas ao modelo normal uni/multivariado já é um problema superado pois atualmente é possível encontrar inúmeros trabalhos que introduzem e desenvolvem generalizações da distribuição normal com relação `a assimetria, curtose e/ou multimodalidade (Branco e Arellano-Valle (2004), Genton (2004), Arellano-Valle et al. (2006)). No contexto dos modelos unidimensionais da Teoria da Resposta ao Item (TRI), Bazán (2005) percebeu esta realidade e introduziu uma classe denominada PANA (Probito Assimétrico - Normal Assimétrica) a qual permite modelar possíveis comportamentos assimétricos de um modelo (uma probabilidade) de resposta ao item bem como a especificação de uma distribuição normal assimétrica para os traços latentes (unidimensionais) a qual é utilizada no processo de estimação. Motivado pela necessidade de melhor representar os fenômenos da área psicométrica (Heinen, 1996, p. 105) e da atual disponibilidade de distribuições elípticas assimétricas cujas propriedades são tão convenientes quanto aquelas devidas `a distribuição normal, a proposta do presente trabalho é apresentar uma extensão do modelo K-dimensional de 3 Parâmetros Probito (Kd3PP) com vetores de traços latentes normalmente distribuídos para o caso t-Assimétrico, gerando, assim, o que denominamos modelo Kd3PP-tA. Nossa proposta, portanto, pode ser considerada como uma extensão do trabalho desenvolvido por Bazán (2005) tanto no sentido de extender a distribuição unidimensional assimétrica dos traços latentes para o caso multidimensional quanto no que conscerne em considerar o achatamento (curtose) da distribuição. Nossa proposta também pode ser vista como uma extensão do trabalho de Béguin e Glas (2001) no sentido de desenvolver o método de estimação bayesiana dos modelos multidimensionais da TRI via DAGS (Dados Aumentados com Amostrador de Gibbs) para o caso em que os vetores de traços latentes comportam-se segundo uma distribuição multivariada t-Assimétrica. No desenvolvimento deste trabalho nos deparamos com uma das principais dificuldades encontradas no processo de estimação e inferência dos modelos multidimensionais da TRI que é a falta de identificabilidade e, com a intenção de ampliar e desmistificar nossos conhecimentos sobre um assunto ainda pouco explorado na literatura da TRI, apresentamos um estudo bibliográfico sobre este tema tanto sob o contexto da inferência clássica quanto bayesiana. Com o intuito de identificar situações particulares em que o uso de uma distribuição normal assimétrica para os traços latentes seja de maior relevância para a estimação e inferência dos parâmetros de item, bem como outros parâmetros relacionados à distribuição dos traços latentes, algumas análises sobre conjuntos de dados simulados são desenvolvidas. Como conclusão destas análises, podemos dizer que há uma melhora superficial quando a informação sobre uma possível assimetria na distribuição dos traços latentes não é ignorada. Além disso, os resultados favoreceram a seleção dos modelos que consideram distribuições assimétricas para os traços latentes, principalmente quando são considerados os modelos que possibilitam a estimação dos parâmetros de localização e escala da distribuição dos vetores de traços latentes. Duas principais contribuições que consideramos de ordem prática, são: a análise e a interpretação de testes através da estimação de modelos uni e multidimensionais da TRI que consideram tanto distribuições simétricas quanto assimétricas para os vetores de traços latentes e a disponibilização de uma função escrita em códigos R e C++ para a estimação dos modelos apresentados e desenvolvidos no presente trabalho. / The lack of alternatives to the univariate or multivariate normal model has been already solved because actually it has been possible to find several works that introduce and develop generalizations of the normal distribution in relation to the asymmetry, kurtosis and/or multimodality (Branco e Arellano-Valle (2004), Genton (2004), Arellano-Valle et al. (2006). In the context of unidimensional models of the Item Response Theory (IRT), Baz´an (2005) observed this fact and introduced a class called PANA (Probito Assimétrico - Normal Assimétrica) which allows to take account for asymmetry in the shape of an item response model (probability) and the specification of a skew normal distribution for unidimensional latent traits which is used in the estimation process. Motivated by the need to better represent the phenomenon of psychometric area (Heinen, 1996, p. 105) and the current availability of skew elliptical distributions whose properties are as convenient as those due to normal distribution, the proposal of this work is to provide an extension of multidimensional 3 Parameters Probit model (Kd3PP) where latent traits vectors are normally distributed for the case of Skew-t distribution (Sahu et al., 2003), generating therefore what we call Kd3PP-St model. Our proposal, therefore, can be regarded as an extension of the work of Bazán (2005) in two ways: the first is extending the unidimensional skew normal distribution of latent traits to the multidimensional case and second in the sense to consider the flattening (kurtosis) of this distribution. Our proposal can also be seen as an extension of the work of B´eguin e Glas (2001) in the sense that we develop the Bayesian estimation method of the 3 parameters multidimensional item response model by DAGS (Augmentated Data with Gibbs sampling) for the case where the latent trait vectors behave according to a Skew-t multivariate distribution. In the development of this work we come across one of the main difficulties encountered in the process of estimation and inference of multidimensional IRT models which is the lack of identifiabilitie and, with the intent to demystify and expand our knowledge on a subject still little explored in the literature of the IRT, we present a bibliographical study on this subject both in the context of classical and Bayesian inference. In order to identify particular situations where the use of a skew normal distribution is more relevant to the estimation and inference of item parameters as well as other parameters related to the distribution of latent traits, some analyses on simulated data sets are developed. As results of these analyses, we can say that there is a modest improvement when information about a possible asymmetry in the distribution of latent traits is not ignored. Moreover, the results favored the selection of models that consider asymmetric distributions for latent traits, especially when models that enable the estimation of parameters of location and scale from this distribution are considered. Two main contributions that we consider of pratical interest are: analysis and interpretations of tests using unidimensional and multidimensional IRT models that consider both simetric and skewed distributions for the vectors of latent traits and a function written in R and C++ language program that is made disponible for the estimation of models treated in this work.
|
39 |
Uma nova abordagem para resolução de problemas de fluxo de carga com variáveis discretas / A new approach for solving load flow problems with discrete variablesScheila Valechenski Biehl 07 May 2012 (has links)
Este trabalho apresenta uma nova abordagem para a modelagem e resolução de problemas de fluxo de carga em sistemas elétricos de potência. O modelo proposto é formado simultaneamente pelo conjunto de equações não lineares que representam as restrições de carga do problema e por restrições de complementaridade associadas com as restrições de operação da rede, as quais propiciam o controle implícito das tensões nas barras com controle de geração. Também é proposta uma técnica para a obtenção dos valores discretos dos taps de tranformadores, de maneira que o ajuste dessas variáveis possa ser realizado em passos discretos. A metodologia desenvolvida consiste em tratar o sistema misto de equações e inequações não lineares como um problema de factibilidade não linear e transformá-lo em um problema de mínimos quadrados não lineares, o qual é resolvido por uma sequência de subproblemas linearizados dentro de uma região de confiança. Para a obtenção de soluções aproximadas desse subproblema foi adotado o método do gradiente conjugado de Steihaug, combinando estratégias de região de confiança e filtros multidimensionais para analisar a qualidade das soluções fornecidas. Foram realizados testes numéricos com os sistemas de 14, 30, 57, 118 e 300 barras do IEEE, e com um sistema brasileiro equivalente CESP 53 barras, os quais indicaram boa flexibilidade e robustez do método proposto. / This work presents a new approach to the load flow problem in electrical power systems and develops a methodology for its resolution. The proposed model is simultaneously composed by nonlinear equations and inequations which represent the load and operational restrictions of the system, where a set of complementarity constraints model the relationship between voltage and reactive power generation in controled buses. It is also proposed a new technique to obtaining a discrete solution for the transformer taps, allowing their discrete adjustment. The method developed treats the mixed system of equations and inequations of the load flow problem as a nonlinear feasibility problem and converts it in a nonlinear least squares problem, which is solved by minimizing a sequence of linearized subproblems, whitin a trust region. To obtain approximate solutions at every iteration, we use the Steihaug conjugate gradient method, combining trust region and multidimensional filters techniques to analyse the quality of the provided solution. Numerical results using 14, 30, 57, 118 and 300-bus IEEE power systems, and a real brazilian equivalent system CESP 53-bus, indicate the flexibility and robustness of the proposed method.
|
40 |
Um estudo sobre o papel de medidas de similaridade em visualização de coleções de documentos / A study on the role of similarity measures in visual text analyticsFrizzi Alejandra San Roman Salazar 27 September 2012 (has links)
Técnicas de visualização de informação, tais como as que utilizam posicionamento de pontos baseado na similaridade do conteúdo, são utilizadas para criar representações visuais de dados que evidenciem certos padrões. Essas técnicas são sensíveis à qualidade dos dados, a qual, por sua vez, depende de uma etapa de pré-processamento muito influente. Esta etapa envolve a limpeza do texto e, em alguns casos, a detecção de termos e seus pesos, bem como a definição de uma função de (dis)similaridade. Poucos são os estudos realizados sobre como esses cálculos de (dis)similaridade afetam a qualidade das representações visuais geradas para dados textuais. Este trabalho apresenta um estudo sobre o papel das diferentes medidas de (dis)similaridade entre pares de textos na geração de mapas visuais. Nos concentramos principalmente em dois tipos de funções de distância, aquelas computadas a partir da representação vetorial do texto (Vector Space Model (VSM)) e em medidas de comparação direta de strings textuais. Comparamos o efeito na geração de mapas visuais com técnicas de posicionamento de pontos, utilizando as duas abordagens. Para isso, foram utilizadas medidas objetivas para comparar a qualidade visual dos mapas, tais como Neighborhood Hit (NH) e Coeficiente de Silhueta (CS). Descobrimos que ambas as abordagens têm pontos a favor, mas de forma geral, o VSM apresentou melhores resultados quanto à discriminação de classes. Porém, a VSM convencional não é incremental, ou seja, novas adições à coleção forçam o recálculo do espaço de dados e das dissimilaridades anteriormente computadas. Nesse sentido, um novo modelo incremental baseado no VSM (Incremental Vector Space Model (iVSM)) foi considerado em nossos estudos comparativos. O iVSM apresentou os melhores resultados quantitativos e qualitativos em diversas configurações testadas. Os resultados da avaliação são apresentados e recomendações sobre a aplicação de diferentes medidas de similaridade de texto em tarefas de análise visual, são oferecidas / Information visualization techniques, such as similarity based point placement, are used for generating of visual data representation that evidence some patterns. These techniques are sensitive to data quality, which depends of a very influential preprocessing step. This step involves cleaning the text and in some cases, detecting terms and their weights, as well as definiting a (dis)similarity function. There are few studies on how these (dis)similarity calculations aect the quality of visual representations for textual data. This work presents a study on the role of the various (dis)similarity measures in generating visual maps. We focus primarily on two types of distance functions, those based on vector representations of the text (Vector Space Model (VSM)) and measures obtained from direct comparison of text strings, comparing the effect on the visual maps obtained with point placement techniques with the two approaches. For this, objective measures were employed to compare the visual quality of the generated maps, such as the Neighborhood Hit and Silhouette Coefficient. We found that both approaches have strengths, but in general, the VSM showed better results as far as class discrimination is concerned. However, the conventional VSM is not incremental, i.e., new additions to the collection force the recalculation of the data space and dissimilarities previously computed. Thus, a new model based on incremental VSM (Incremental Vector Space Model (iVSM)) has been also considered in our comparative studies. iVSM showed the best quantitative and qualitative results in several of the configurations considered. The evaluation results are presented and recommendations on the application of different similarity measures for text analysis tasks visually are provided
|
Page generated in 0.0803 seconds