• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1519
  • 38
  • 27
  • 20
  • 20
  • 19
  • 15
  • 14
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 1596
  • 825
  • 659
  • 403
  • 259
  • 220
  • 182
  • 162
  • 141
  • 138
  • 137
  • 135
  • 126
  • 124
  • 121
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
541

Estudo de desempenho de filtros para particulados e seleção de respiradores para uso em mineradoras. / Study of particulate filters performance and selection of respirators for use in mining.

Camargo, Osny Ferreira de 11 July 2007 (has links)
A proteção respiratória é largamente utilizada como medida de controle da exposição dos trabalhadores a particulados em suspensão no ar ambiente de trabalho em mineração. A composição química desses particulados influi nos efeitos sobre a saúde dos trabalhadores expostos e também pode afetar o desempenho do material filtrante dos respiradores. Materiais particulados oleosos suspensos no ar encontrados em ambientes de mineração podem afetar desfavoravelmente as cargas eletrostáticas comumente adicionadas às fibras dos filtros para particulados. Por essa razão os testes de laboratório dos filtros procuram simular algumas condições desfavoráveis encontradas nos ambientes de trabalho e incluem nos procedimentos de testes ensaios com substancias oleosas como o óleo de parafina ou o óleo de DOP. Os particulados não oleosos são representados nos ensaios por partículas de cloreto de sódio. O objetivo desta dissertação é comparar três métodos de ensaios para aprovação de filtros para particulados utilizados em respiradores purificadores de ar não motorizados e relacionar as condições de ensaios com as condições onde os filtros são usados em trabalhos de minerações. Para chegar a esse objetivo foram realizadas pesquisas bibliográficas sobre os riscos da exposição a particulados na indústria mineral, o uso de equipamentos de proteção respiratória e mecanismos usados para filtração de particulados; estudados os métodos de teste descritos em três normas (EN 143 européia, 42 CFR 84 norte americana e NBR 13697 brasileira), comparados os princípios de funcionamento dos equipamentos de testes Moore´s e TSI 8110/8130, e analisados resultados de estudos comparativos realizados com esses equipamentos. Conclui que os métodos de testes de desempenho submetem os filtros a condições bem mais agressivas que aquelas encontradas na maioria das condições de trabalho de mineração; que os métodos de testes europeus e norte-americanos submetem os filtros a condições semelhantes, enquanto o método brasileiro é mais brando, uma vez que não requer que a eficiência do filtro seja medida durante e após a deposição de quantidades definidas de aerossol de teste; que equipamentos de testes mais modernos que os utilizados para aprovação de filtros no Brasil incorporam progressos tecnológicos que permitem melhor repetitividade de resultados; que resultados de estudos comparativos realizados entre laboratórios mostram boa correlação entre as medições da eficiência obtidas por equipamentos Moore\'s utilizados na comunidade européia e Brasil, TSI 8110 e TSI 8130, este último utilizado pelo NIOSH nos EUA. / Respiratory protection is widely used in mining operations in order to control the worker\'s exposure to airborne particulates present in the workplaces. Chemical composition of these particulates impacts on the worker\'s health and can also affect the respirator filter media. Oily aerosols found in mining environments affect the electrostatic filter media with enhanced performance over mechanical filters. Therefore, filters laboratory tests include oily substances such as paraffin oil and DOP (Di-octil phthalate) in the test procedures, simulating some workplace unfavorable conditions. Non-oily particulates are represented by sodium chloride particles. This dissertation compares the test methods described in following standards: the European standard EN 143, the document 42 CFR 84 adopted by NIOSH (National Institute for Occupational Safety and Health) in United States of America (USA), and the Brazilian ABNT NBR 13697 adopted by Ministry of Labor of Brazil (MTE) and Fundação Jorge Duprat de Figueiredo (Fundacentro). This dissertation also compares the test methods conditions with the environemntal conditions likely found in mineral industry. The applied methodology includes a bibliographic research about workplace environmental risk in mining industry, the use of respiratory protective devices and particulate filters technology. Also includes a study of the three test methods (EN 143, 42CFR 84 and NBR 13697), principles of Moore´s and TSI 8110/8130 test instruments and analysis of inter- laboratory test studies made in Europe and USA. The conclusion shows that the test methods mentioned above subject the filters to conditions which are much more aggressive than the typical minig environments; that the European and USA test methods subject filters to comparable test conditions, while tests specified in Brazilian standards are more moderate compared to the European and North American, because filter loading is not required during the test; that new technologies incorporated in the test instruments improve repeatability and accuracy of test results; that comparison data obtained with many test instruments, made by various instrument makers allow one to conclude that there is good correlation between these instruments, in general and between the European´s Moore´s 4400 Tester Rig and the two TSI, AFT 8110 and AFT 8130, specifically.
542

Aplicação de um método de simulação-otimização na cadeia produtiva de minérios de ferro. / Application of a simulation-optimization method in the iron ore producty chain.

Ceciliano, Wellington Rodrigo Aparecido 27 August 2007 (has links)
O mercado de minérios de ferro e aço está extremamente aquecido nesta primeira década do século XXI, e como mostram os especialistas neste assunto deverá permanecer desta forma por no mínimo mais 5 ou 10 anos. Com o aumento substancial de preços das \"commodities\", principalmente os minérios de ferro, nesta década há nas indústrias ou corporações uma alta disponibilidade de recursos para bons projetos. Desta forma, a empresa que tiver condições de tomar decisões estratégicas melhores, mais rápidas e mais fundamentadas garantirá a perpetuidade do negócio neste mundo competitivo. O principal objetivo desta dissertação é o desenvolvimento e aplicação de um método de tomada de decisão, que utilize simulação-otimização durante o processo de planejamento do negócio. Este método será aplicado na cadeia produtiva de minérios de ferro da Samarco Mineração S/A, com o propósito de melhorar a qualidade das informações do processo de escolha da melhor alternativa de investimentos para os próximos 05 anos. Este método demonstrou uma melhora na qualidade do processo decisório de escolha dos investimentos, além disso, observou-se que o desdobramento em fases garantido pelo método proposto, converge diversos fatores, simplificando e otimizando a tomada de decisão gerencial. Ao avaliar e confrontar os conceitos de simulação e otimização, observou-se que existe um grande conjunto de experiências bem explorado de técnicas para resolução de problemas no sentido de aprimorar, em cada uma das áreas de conhecimento (simulação e otimização) separadamente a busca da melhor solução, deixando de se aproveitar o potencial que se pode conseguir com a integração dessas técnicas. Neste sentido procurou-se evidenciar que não era objetivo desta pesquisa analisar qual é a melhor técnica a ser empregada em cada problema que afeta os sistemas logísticos em geral, e sim potencializar a discussão, assim como muitos autores apresentados neste trabalho, que estas técnicas são complementares e que o sucesso da solução do problema ou oportunidade é proporcional a correta aplicação destas técnicas em seus pontos fortes de resolução de problema. E os casos apresentados e o método aqui proposto reforçam que a aplicação destas técnicas em conjunto garantem um melhor resultado do que o emprego destas ferramentas separadamente. / World demand for iron ore and steel industries are extremely high in the very beginning of the 21st century, and the analysts are foreseeing that it will last for a long period. Likewise the commodities in general, the prices of iron ore have been increasing considerably, mainly because of the disarticulation through this industry supply chain. Considering the systemic aspects of this particular market, the decisions to invest in upstream capacities to supply the demand is very complex and risky. The complexity is related with assets intensiveness, competitor\'s movements, time between decision to implant a project and startup, and the demand-price ups and downs cycles. The companies that make the right strategic decisions, at the right time, are the ones that will succeed in this competitive and global market. The objective of this dissertation is to develop a methodology, using simulationoptimization techniques that support strategic investments decisions. In the research part of this dissertation, a sort of concepts and techniques of simulation, heuristics and optimization were explored and it was possible to identify an opportunity to explore the potential integration of techniques. In particular, this dissertation aims to clarify that this techniques may be complementary, and the success if very much related with the correct approach to combine them considering the particularities of the studied problem. The results have shown that the proposed method clarify that the right combination of techniques, in this case, simulation-optimization, is produces better results and individual application of each one of them. The method was applied at Samarco in its business planning process, and it has been useful to support better investments decisions.
543

Aprendizado de máquina parcialmente supervisionado multidescrição para realimentação de relevância em recuperação de informação na WEB / Partially supervised multi-view machine learning for relevance feedback in WEB information retrieval

Soares, Matheus Victor Brum 28 May 2009 (has links)
Atualmente, o meio mais comum de busca de informações é a WEB. Assim, é importante procurar métodos eficientes para recuperar essa informação. As máquinas de busca na WEB usualmente utilizam palavras-chaves para expressar uma busca. Porém, não é trivial caracterizar a informação desejada. Usuários diferentes com necessidades diferentes podem estar interessados em informações relacionadas, mas distintas, ao realizar a mesma busca. O processo de realimentação de relevância torna possível a participação ativa do usuário no processo de busca. A idéia geral desse processo consiste em, após o usuário realizar uma busca na WEB permitir que indique, dentre os sites encontrados, quais deles considera relevantes e não relevantes. A opinião do usuário pode então ser considerada para reordenar os dados, de forma que os sites relevantes para o usuário sejam retornados mais facilmente. Nesse contexto, e considerando que, na grande maioria dos casos, uma consulta retorna um número muito grande de sites WEB que a satisfazem, das quais o usuário é responsável por indicar um pequeno número de sites relevantes e não relevantes, tem-se o cenário ideal para utilizar aprendizado parcialmente supervisionado, pois essa classe de algoritmos de aprendizado requer um número pequeno de exemplos rotulados e um grande número de exemplos não-rotulados. Assim, partindo da hipótese que a utilização de aprendizado parcialmente supervisionado é apropriada para induzir um classificador que pode ser utilizado como um filtro de realimentação de relevância para buscas na WEB, o objetivo deste trabalho consiste em explorar algoritmos de aprendizado parcialmente supervisionado, mais especificamente, aqueles que utilizam multidescrição de dados, para auxiliar na recuperação de sites na WEB. Para avaliar esta hipótese foi projetada e desenvolvida uma ferramenta denominada C-SEARCH que realiza esta reordenação dos sites a partir da indicação do usuário. Experimentos mostram que, em casos que buscas genéricas, que o resultado possui um bom diferencial entre sites relevantes e irrelevantes, o sistema consegue obter melhores resultados para o usuário / As nowadays the WEB is the most common source of information, it is very important to find reliable and efficient methods to retrieve this information. However, the WEB is a highly volatile and heterogeneous information source, thus keyword based querying may not be the best approach when few information is given. This is due to the fact that different users with different needs may want distinct information, although related to the same keyword query. The process of relevance feedback makes it possible for the user to interact actively with the search engine. The main idea is that after performing an initial search in the WEB, the process enables the user to indicate, among the retrieved sites, a small number of the ones considered relevant or irrelevant according with his/her required information. The users preferences can then be used to rearrange sites returned in the initial search, so that relevant sites are ranked first. As in most cases a search returns a large amount of WEB sites which fits the keyword query, this is an ideal situation to use partially supervised machine learning algorithms. This kind of learning algorithms require a small number of labeled examples, and a large number of unlabeled examples. Thus, based on the assumption that the use of partially supervised learning is appropriate to induce a classifier that can be used as a filter for relevance feedback in WEB information retrieval, the aim of this work is to explore the use of a partially supervised machine learning algorithm, more specifically, one that uses multi-description data, in order to assist the WEB search. To this end, a computational tool called C-SEARCH, which performs the reordering of the searched results using the users feedback, has been implemented. Experimental results show that in cases where the keyword query is generic and there is a clear distinction between relevant and irrelevant sites, which is recognized by the user, the system can achieve good results
544

Metodologia para mapeamento de informações não estruturadas descritas em laudos médicos para uma representação atributo-valor / A methodology for mapping non-structured medical findings to the attribute-value table format

Honorato, Daniel de Faveri 29 April 2008 (has links)
Devido à facilidade com que informações biomédicas em língua natural são registras e armazenadas no formato digital, a recuperação de informações a partir de registros de pacientes nesse formato não estruturado apresenta diversos problemas a serem solucionados. Assim, a extração de informações estruturadas (por exemplo, no formato atributo-valor) a partir de registros não estruturados é um importante problema de pesquisa. Além disso, a representação de registros médicos não estruturados no formato atributo-valor, permite a aplicação de uma grande variedade de métodos de extração de padrões. Para mapear registros médicos não estruturados no formato atributo-valor, propomos uma metodologia que pode ser utilizada para automaticamente (ou semi-automaticamente, com a ajuda de um especialista do domínio) mapear informações médicas de interesse armazenadas nos registros médicos e descritas em linguagem natural em um formato estruturado. Essa metodologia foi implementada em um sistema computacional chamado TP-DISCOVER, o qual gera uma tabela no formato atributo-valor a partir de um conjunto de registros de pacientes (documentos). De modo a identificar entidades importantes no conjunto de documentos, assim como relacionamentos significantes entre essas entidades, propomos uma abordagem de extração de terminologia híbrida (lingüística/estatística) a qual seleciona palavras e frases que aparecem com freqüência acima de um dado limiar por meio da aplicação de medidas estatísticas. A idéia geral dessa abordagem híbrida de extração de terminologia é que documentos especializados são caracterizados por repetir o uso de certas unidades léxicas ou construções morfo-sintáticas. Nosso objetivo é reduzir o esforço despendido na modelagem manual por meio da observação de regularidades no texto e o mapeamento dessas regularidades como nomes de atributos na representação atributo-valor. A metodologia proposta foi avaliada realizando a estruturação automática de uma coleção de 6000 documentos com informações de resultados de exames de Endoscopia Digestiva Alta descritos em língua natural. Os resultados experimentais, os quais podem ser considerados os piores resultados, uma vez que esses resultados poderiam ser muito melhores caso a metodologia for utilizada semi-automaticamente junto com um especialista do domínio, mostram que a metodologia proposta é adequada e permite reduzir o tempo usado pelo especialista para analisar grande quantidade de registros médicos / The information retrieval from text stored in computer-based patient records is an important open-ended research problem, as the ease in which biomedical information recorded and stored in digital form grows. Thus, means to extract structured information (for example, in the so-called attribute-value format) from free-text records is an important research endeavor. Furthermore, by representing the free-text records in the attribute-value format, available pattern extraction methods can be directly applied. To map free-text medical records into the attribute-value format, we propose a methodology that can be used to automatically (or semi-automatically, with the help of a medical expert) map the important medical information stored in patient records which are described in natural language into an structured format. This methodology has been implemented in a computational system called TP-DISCOVER, which generates a database in the attribute-value format from a set of patient records (documents). In order to identify important entities in the set of documents, as well as significant relations among these entities, we propose a hybrid linguistic/statistical terminology extraction approach which filters out words and phrases that appear with a frequency higher than a given threshold by applying statistical measures. The underlying assumption of this hybrid approach to terminology extraction is that specialized documents are characterized by repeated use of certain lexical units or morpho-syntactic constructions. Our goal is to reduce the effort spent in manual modelling by observing regularities in the texts and by mapping them into suitable attribute names in the attribute-value representation format. The proposed methodology was evaluated to automatically structure a collection of 6000 documents which contains High Digestive Endoscopies exams´ results described in natural language. The experimental results, all of which can be considered lower bound results as they would greatly improve in case the methodology is applied semi-automatically together with a medical expert, show that the proposed methodology is suitable to reduce the medical expert workload in analysing large amounts of medical records
545

"Generalização de regras de associação" / Generalization of association rules

Domingues, Marcos Aurélio 27 April 2004 (has links)
Mineração de Dados é um processo de natureza iterativa e interativa responsável por identificar padrões em grandes conjuntos de dados, objetivando extrair conhecimento válido, útil e inovador a partir desses. Em Mineração de Dados, Regras de Associação é uma técnica que consiste na identificação de padrões intrínsecos ao conjunto de dados. Essa técnica tem despertado grande interesse nos pesquisadores de Mineração de Dados e nas organizações, entretanto, a mesma possui o inconveniente de gerar grande volume de conhecimento no formato de regras, dificultando a análise e interpretação dos resultados pelo usuário. Nesse contexto, este trabalho tem como objetivo principal generalizar e eliminar Regras de Associação não interessantes e/ou redundantes, facilitando, dessa maneira, a análise das regras obtidas com relação à compreensibilidade e tamanho do conjunto de regras. A generalização das Regras de Associação é realizada com o uso de taxonomias. Entre os principais resultados deste trabalho destacam-se a proposta e a implementação do algoritmo GART e do módulo computacional RulEE-GAR. O algoritmo GART (Generalization of Association Rules using Taxonomies - Generalização de Regras de Associação usando Taxonomias) utiliza taxonomias para generalizar Regras de Associação. Já o módulo RulEE-GAR, além de facilitar o uso do algoritmo GART durante a identificação de taxonomias e generalização de regras, provê funcionalidades para analisar as Regras de Associação generalizadas. Os experimentos realizados, neste trabalho, mostraram que o uso de taxonomias na generalização de Regras de Associação pode reduzir o volume de um conjunto de regras. / Data Mining refers to the process of finding patterns in large data sets. The Association Rules in Data Mining try to identify intrinsic behaviors of the data set. This has motivated researchers of Data Mining and organizations. However, the Association Rules have the inconvenient of generating a great amount of knowledge in the form of rules. This makes the analysis and interpretation of the results difficult for the user. Taking this into account, the main objective of this research is the generalization and elimination of non-interesting and/or redundant Association Rules. This facilite the analysis of the rules with respect to the compreensibility and the size of the rule set. The generalization is realized using taxonomies. The main results of this research are the proposal and the implementation of the algorithm GART and of the computational module RulEE-GAR. The algorithm GART (Generalization of Association Rules using Taxonomies) uses taxonomies to generalize Association Rules. The module RulEE-GAR facilitates the use of the algorithm GART in the identification of taxonomies and generalization of rules and provide functionalities to the analysis of the generalized Association Rules. The results of experiments showed that the employment of taxonomies in the generalization of Association Rules can reduce the size of a rule set.
546

Aspectos semânticos na representação de textos para classificação automática / Semantic aspects in the representation of texts for automatic classification

Sinoara, Roberta Akemi 24 May 2018 (has links)
Dada a grande quantidade e diversidade de dados textuais sendo criados diariamente, as aplicações do processo de Mineração de Textos são inúmeras e variadas. Nesse processo, a qualidade da solução final depende, em parte, do modelo de representação de textos adotado. Por se tratar de textos em língua natural, relações sintáticas e semânticas influenciam o seu significado. No entanto, modelos tradicionais de representação de textos se limitam às palavras, não sendo possível diferenciar documentos que possuem o mesmo vocabulário, mas que apresentam visões diferentes sobre um mesmo assunto. Nesse contexto, este trabalho foi motivado pela diversidade das aplicações da tarefa de classificação automática de textos, pelo potencial das representações no modelo espaço-vetorial e pela lacuna referente ao tratamento da semântica inerente aos dados em língua natural. O seu desenvolvimento teve o propósito geral de avançar as pesquisas da área de Mineração de Textos em relação à incorporação de aspectos semânticos na representação de coleções de documentos. Um mapeamento sistemático da literatura da área foi realizado e os problemas de classificação foram categorizados em relação à complexidade semântica envolvida. Aspectos semânticos foram abordados com a proposta, bem como o desenvolvimento e a avaliação de sete modelos de representação de textos: (i) gBoED, modelo que incorpora a semântica obtida por meio de conhecimento do domínio; (ii) Uni-based, modelo que incorpora a semântica por meio da desambiguação lexical de sentidos e hiperônimos de conceitos; (iii) SR-based Terms e SR-based Sentences, modelos que incorporam a semântica por meio de anotações de papéis semânticos; (iv) NASARIdocs, Babel2Vec e NASARI+Babel2Vec, modelos que incorporam a semântica por meio de desambiguação lexical de sentidos e embeddings de palavras e conceitos. Representações de coleções de documentos geradas com os modelos propostos e outros da literatura foram analisadas e avaliadas na classificação automática de textos, considerando datasets de diferentes níveis de complexidade semântica. As propostas gBoED, Uni-based, SR-based Terms e SR-based Sentences apresentam atributos mais expressivos e possibilitam uma melhor interpretação da representação dos documentos. Já as propostas NASARIdocs, Babel2Vec e NASARI+Babel2Vec incorporam, de maneira latente, a semântica obtida de embeddings geradas a partir de uma grande quantidade de documentos externos. Essa propriedade tem um impacto positivo na performance de classificação. / Text Mining applications are numerous and varied since a huge amount of textual data are created daily. The quality of the final solution of a Text Mining process depends, among other factors, on the adopted text representation model. Despite the fact that syntactic and semantic relations influence natural language meaning, traditional text representation models are limited to words. The use of such models does not allow the differentiation of documents that use the same vocabulary but present different ideas about the same subject. The motivation of this work relies on the diversity of text classification applications, the potential of vector space model representations and the challenge of dealing with text semantics. Having the general purpose of advance the field of semantic representation of documents, we first conducted a systematic mapping study of semantics-concerned Text Mining studies and we categorized classification problems according to their semantic complexity. Then, we approached semantic aspects of texts through the proposal, analysis, and evaluation of seven text representation models: (i) gBoED, which incorporates text semantics by the use of domain expressions; (ii) Uni-based, which takes advantage of word sense disambiguation and hypernym relations; (iii) SR-based Terms and SR-based Sentences, which make use of semantic role labels; (iv) NASARIdocs, Babel2Vec and NASARI+Babel2Vec, which take advantage of word sense disambiguation and embeddings of words and senses.We analyzed the expressiveness and interpretability of the proposed text representation models and evaluated their classification performance against different literature models. While the proposed models gBoED, Uni-based, SR-based Terms and SR-based Sentences have improved expressiveness, the proposals NASARIdocs, Babel2Vec and NASARI+Babel2Vec are latently enriched by the embeddings semantics, obtained from the large training corpus. This property has a positive impact on text classification performance.
547

Trabalho e cotidiano na mineiração aurífera inglesa em Minas Gerais: A Mina da Passagem de Mariana / Labour and everyday in the English auriferous mining in Minas Gerais: the Mina de Passagem of Mariana city

Souza, Rafael de Freitas e 03 August 2009 (has links)
Esta pesquisa destaca a história da mineração aurífera inglesa em Minas Gerais na segunda metade do século XIX até 1927. Nosso objetivo foi levantar a baeta de ferro que encobre a trajetória destes gigantescos empreendimentos fabris enfocando o caso da Mina da Passagem situada na cidade de Mariana. O processo de mono-industrialização capitalista vivido por um pequeno arraial aurífero mineiro insere-o numa nova realidade sócio-laboral. Por isso, o mundo do trabalho na mina e a vida fora dela foram analisados sob uma perspectiva dialeticamente complementar. A extração do ouro da jazida primária exigiu da companhia técnicas, maquinários, normas e relações de trabalho típicas do capitalismo. Para isso, fez uso do trabalho escravo e do trabalho livre de nacionais e imigrantes europeus, assim como da mão-de-obra feminina e infantil. As duras condições de trabalho no subsolo e na superfície a que estavam submetidos o(a)s mineiro(a)s fizeram seu cotidiano ser marcado por contínuos acidentes e enfermidades avassaladoras. É neste contexto que entendemos a relação trabalho/religiosidade matizada pela crença em entidades metafísicas que os acompanhavam em sua faina diária. A presença de ingleses, nacionais, africanos e imigrantes europeus fizeram de Passagem de Mariana um típica zona de contato. Os hábitos sociais, esportes, lazeres, formas de organização e resistência são fruto dos entrelaçamentos harmoniosos e tensos entre estes atores sociais. Por fim, tentamos esboçar outro ponto de vista no que tange aos legados da companhia inglesa para os trabalhadores e a localidade. Verificamos que seu passivo sócioambiental sobrepuja seus pretensos benefícios. / This study emphasizes the history of english auriferous mining in Minas Gerais State from the second half of 19th century until 1927. Our purpose was to raise the baeta de ferro (iron tissue) that covers the trajectory of these giant factory undertaking, focusing the Mina da Passagem case located in Mariana City. The capitalist one-industrialization process lived by a small miner auriferous village introduce the place into a new social-labour reality. For this reason, the work cycle in the mine and the life outside were analyzed under a supplementary dialectally perspective. The gold extraction from the primary bed demanded from the company: techniques, machinery, rules and work relations characteristics of capitalism. In order that, it used the slave work and the free work of natives and European immigrants, as well as female and infant labour. The hard work conditions in the underground and surface that the workers were submitted to made their everyday be marked by ongoing accidents and great diseases. It is in this context that we understand the work/religiosity relation adorned by the belief in metaphysical entities that came along with the workers in their daily work. The presence of Englishmen, Natives, Africans and European immigrants transformed Mina de Passagem a typical contact zone. The social habits, sports, leisure time, organization structures and resistance are the results of the harmonious and tense interlacements between these social actors. At last, we have tried to sketch another point of view touching the English company legates for the workers and the place. We have verified that its social-environment passive surpass its alleged benefits.
548

Extração de tópicos baseado em agrupamento de regras de associação / Topic extraction based on association rule clustering

Santos, Fabiano Fernandes dos 29 May 2015 (has links)
Uma representação estruturada dos documentos em um formato apropriado para a obtenção automática de conhecimento, sem que haja perda de informações relevantes em relação ao formato originalmente não-estruturado, é um dos passos mais importantes da mineração de textos, pois a qualidade dos resultados obtidos com as abordagens automáticas para obtenção de conhecimento de textos estão fortemente relacionados à qualidade dos atributos utilizados para representar a coleção de documentos. O Modelo de Espaço de Vetores (MEV) é um modelo tradicional para obter uma representação estruturada dos documentos. Neste modelo, cada documento é representado por um vetor de pesos correspondentes aos atributos do texto. O modelo bag-of-words é a abordagem de MEV mais utilizada devido a sua simplicidade e aplicabilidade. Entretanto, o modelo bag-of-words não trata a dependência entre termos e possui alta dimensionalidade. Diversos modelos para representação dos documentos foram propostos na literatura visando capturar a informação de relação entre termos, destacando-se os modelos baseados em frases ou termos compostos, o Modelo de Espaço de Vetores Generalizado (MEVG) e suas extensões, modelos de tópicos não-probabilísticos, como o Latent Semantic Analysis (LSA) ou o Non-negative Matrix Factorization (NMF), e modelos de tópicos probabilísticos, como o Latent Dirichlet Allocation (LDA) e suas extensões. A representação baseada em modelos de tópicos é uma das abordagens mais interessantes uma vez que elas fornece uma estrutura que descreve a coleção de documentos em uma forma que revela sua estrutura interna e as suas inter-relações. As abordagens de extração de tópicos também fornecem uma estratégia de redução da dimensionalidade visando a construção de novas dimensões que representam os principais tópicos ou assuntos identificados na coleção de documentos. Entretanto, a extração é eficiente de informações sobre as relações entre os termos para construção da representação de documentos ainda é um grande desafio de pesquisa. Os modelos para representação de documentos que exploram a correlação entre termos normalmente enfrentam um grande desafio para manter um bom equilíbrio entre (i) a quantidade de dimensões obtidas, (ii) o esforço computacional e (iii) a interpretabilidade das novas dimensões obtidas. Assim,é proposto neste trabalho o modelo para representação de documentos Latent Association Rule Cluster based Model (LARCM). Este é um modelo de extração de tópicos não-probabilístico que explora o agrupamento de regras de associação para construir uma representação da coleção de documentos com dimensionalidade reduzida tal que as novas dimensões são extraídas a partir das informações sobre as relações entre os termos. No modelo proposto, as regras de associação são extraídas para cada documento para obter termos correlacionados que formam expressões multi-palavras. Essas relações entre os termos formam o contexto local da relação entre termos. Em seguida, aplica-se um processo de agrupamento em todas as regras de associação para formar o contexto geral das relações entre os termos, e cada grupo de regras de associação obtido formará um tópico, ou seja, uma dimensão da representação. Também é proposto neste trabalho uma metodologia de avaliação que permite selecionar modelos que maximizam tanto os resultados na tarefa de classificação de textos quanto os resultados de interpretabilidade dos tópicos obtidos. O modelo LARCM foi comparado com o modelo LDA tradicional e o modelo LDA utilizando uma representação que inclui termos compostos (bag-of-related-words). Os resultados dos experimentos indicam que o modelo LARCM produz uma representação para os documentos que contribui significativamente para a melhora dos resultados na tarefa de classificação de textos, mantendo também uma boa interpretabilidade dos tópicos obtidos. O modelo LARCM também apresentou ótimo desempenho quando utilizado para extração de informação de contexto para aplicação em sistemas de recomendação sensíveis ao contexto. / A structured representation of documents in an appropriate format for the automatic knowledge extraction without loss of relevant information is one of the most important steps of text mining, since the quality of the results obtained with automatic approaches for the text knowledge extraction is strongly related to the quality of the selected attributes to represent the collection of documents. The Vector Space model (VSM) is a traditional structured representation of documents. In this model, each document is represented as a vector of weights that corresponds to the features of the document. The bag-of-words model is the most popular VSM approach because of its simplicity and general applicability. However, the bag-of-words model does not include dependencies of the terms and has a high dimensionality. Several models for document representation have been proposed in the literature in order to capture the dependence among the terms, especially models based on phrases or compound terms, the Generalized Vector Space Model (GVSM) and their extensions, non-probabilistic topic models as Latent Semantic Analysis (LSA) or Non-negative Matrix Factorization (NMF) and still probabilistic topic models as the Latent Dirichlet Allocation (LDA) and their extensions. The topic model representation is one of the most interesting approaches since it provides a structure that describes the collection of documents in a way that reveals their internal structure and their interrelationships. Also, this approach provides a dimensionality reduction strategy aiming to built new dimensions that represent the main topics or ideas of the document collection. However, the efficient extraction of information about the relations of terms for document representation is still a major research challenge nowadays. The document representation models that explore correlated terms usually face a great challenge of keeping a good balance among the (i) number of extracted features, (ii) the computational performance and (iii) the interpretability of new features. In this way, we proposed the Latent Association Rule Cluster based Model (LARCM). The LARCM is a non-probabilistic topic model that explores association rule clustering to build a document representation with low dimensionality in a way that each dimension is composed by information about the relations among the terms. In the proposed approach, the association rules are built for each document to extract the correlated terms that will compose the multi-word expressions. These relations among the terms are the local context of relations. Then, a clustering process is applied for all association rules to discover the general context of the relations, and each obtained cluster is an extracted topic or a dimension of the new document representation. This work also proposes in this work an evaluation methodology to select topic models that maximize the results in the text classification task as much as the interpretability of the obtained topics. The LARCM model was compared against both the traditional LDA model and the LDA model using a document representation that includes multi-word expressions (bag-of-related-words). The experimental results indicate that LARCM provides an document representation that improves the results in the text classification task and even retains a good interpretability of the extract topics. The LARCM model also achieved great results as a method to extract contextual information for context-aware recommender systems.
549

Organização flexível de documentos / Flexible organization of documents

Rios, Tatiane Nogueira 25 March 2013 (has links)
Diversos métodos têm sido desenvolvidos para a organização da crescente quantidade de documentos textuais. Esses métodos frequentemente fazem uso de algoritmos de agrupamento para organizar documentos que referem-se a um mesmo assunto em um mesmo grupo, supondo que conteúdos de documentos de um mesmo grupo são similares. Porém, existe a possibilidade de que documentos pertencentes a grupos distintos também apresentem características semelhantes. Considerando esta situação, há a necessidade de desenvolver métodos que possibilitem a organização flexível de documentos, ou seja, métodos que possibilitem que documentos sejam organizados em diferentes grupos com diferentes graus de compatibilidade. O agrupamento fuzzy de documentos textuais apresenta-se como uma técnica adequada para este tipo de organização, uma vez que algoritmos de agrupamento fuzzy consideram que um mesmo documento pode ser compatível com mais de um grupo. Embora tem-se desenvolvido algoritmos de agrupamento fuzzy que possibilitam a organização flexível de documentos, tal organização é avaliada em termos do desempenho do agrupamento de documentos. No entanto, considerando que grupos de documentos devem possuir descritores que identifiquem adequadamente os tópicos representados pelos mesmos, de maneira geral os descritores de grupos tem sido extraídos utilizando alguma heurística sobre um conjunto pequeno de documentos, realizando assim, uma avaliação simples sobre o significado dos grupos extraídos. No entanto, uma apropriada extração e avaliação de descritores de grupos é importante porque os mesmos são termos representantes da coleção que identificam os tópicos abordados nos documentos. Portanto, em aplicações em que o agrupamento fuzzy é utilizado para a organização flexível de documentos, uma descrição apropriada dos grupos obtidos é tão importante quanto um bom agrupamento, uma vez que, neste tipo de agrupamento, um mesmo descritor pode indicar o conteúdo de mais de um grupo. Essa necessidade motivou esta tese, cujo objetivo foi investigar e desenvolver métodos para a extração de descritores de grupos fuzzy para a organização flexível de documentos. Para cumprir esse objetivo desenvolveu se: i) o método SoftO-FDCL (Soft Organization - Fuzzy Description Comes Last ), pelo qual descritores de grupos fuzzy at são extraídos após o processo de agrupamento fuzzy, visando identicar tópicos da organização flexível de documentos independentemente do algoritmo de agrupamento fuzzy utilizado; ii) o método SoftO-wFDCL ( Soft Organization - weighted Fuzzy Description Comes Last ), pelo qual descritores de grupos fuzzy at também são extraídos após o processo de agrupamento fuzzy utilizando o grau de pertinência dos documentos em cada grupo, obtidos do agrupamento fuzzy, como fator de ponderação dos termos candidatos a descritores; iii) o método HSoftO-FDCL (Hierarchical Soft Organization - Fuzzy Description Comes Last ), pelo qual descritores de grupos fuzzy hierárquicos são extraídos após o processo de agrupamento hierárquico fuzzy, identificando tópicos da organização hierárquica flexível de documentos. Adicionalmente, apresenta-se nesta tese uma aplicação do método SoftO-FDCL no contexto do programa de educação médica continuada canadense, reforçando a utilidade e aplicabilidade da organização flexível de documentos / Several methods have been developed to organize the growing number of textual documents. Such methods frequently use clustering algorithms to organize documents with similar topics into clusters. However, there are situations when documents of dffierent clusters can also have similar characteristics. In order to overcome this drawback, it is necessary to develop methods that permit a soft document organization, i.e., clustering documents into different clusters according to different compatibility degrees. Among the techniques that we can use to develop methods in this sense, we highlight fuzzy clustering algorithms (FCA). By using FCA, one of the most important steps is the evaluation of the yield organization, which is performed considering that all analyzed topics are adequately identified by cluster descriptors. In general, cluster descriptors are extracted using some heuristic over a small number of documents. The adequate extraction and evaluation of cluster descriptors is important because they are terms that represent the collection and identify the topics of the documents. Therefore, an adequate description of the obtained clusters is as important as a good clustering, since the same descriptor might identify one or more clusters. Hence, the development of methods to extract descriptors from fuzzy clusters obtained for soft organization of documents motivated this thesis. Aiming at investigating such methods, we developed: i) the SoftO-FDCL (Soft Organization - Fuzzy Description Comes Last) method, in which descriptors of fuzzy clusters are extracted after clustering documents, identifying topics regardless the adopted fuzzy clustering algorithm; ii) the SoftO-wFDCL (Soft Organization - weighted Fuzzy Description Comes Last) method, in which descriptors of fuzzy clusters are also extracted after the fuzzy clustering process using the membership degrees of the documents as a weighted factor for the candidate descriptors; iii) the HSoftO-FDCL (Hierarchical Soft Organization - Fuzzy Description Comes Last) method, in which descriptors of hierarchical fuzzy clusters are extracted after the hierarchical fuzzy clustering process, identifying topics by means of a soft hierarchical organization of documents. Besides presenting these new methods, this thesis also discusses the application of the SoftO-FDCL method on documents produced by the Canadian continuing medical education program, presenting the utility and applicability of the soft organization of documents in real-world scenario
550

Metodologia de planejamento estratégico de lavra incorporando riscos e incertezas para a obtenção de resultados operacionais. / Strategical minnig planning methodology incorporating risks and uncertanties to obtain operational results.

Silva, Nelson Camurugi Senhorinho 15 January 2008 (has links)
O planejamento estratégico de lavra corresponde ao processo para se determinar o \"melhor\" projeto e sequenciamento da lavra, segundo uma estratégia previamente estabelecida. É considerado um elemento chave para o sucesso de um empreendimento de mineração, uma vez que subsidia o processo decisório sobre a sua condução e desenvolvimento. Métodos de planejamento estratégico de lavra convencionais estão baseados em modelos determinísticos, que não são capazes de tomar em consideração a variabilidade intrínseca dos principais elementos que os compõem, consequentemente, podem apresentar resultados bastante distantes da realidade e muitas vezes até comprometer a viabilidade do empreendimento. As incertezas geológicas são consideradas como as principais contribuintes para que projetos de mineração falhem em alcançar as expectativas originalmente projetadas. Este estudo apresenta uma metodologia abrangente, que de forma multi-estagiada, utiliza modelos condicionalmente simulados para quantificar e transferir os riscos associados às propriedades geológicas ao longo do processo de planejamento de lavra. Esta função de transferência integra e incorpora distintos métodos de análises quantitativas, incluindo: Teoria Gráfica; Teoria dos Conjuntos; Realces Flutuantes; e Programação Dinâmica. Seus resultados são finalmente convertidos em atividades de lavra, constituindo um sequenciamento de lavra global, controlado pelos riscos, e adicionalmente refinado a partir de uma interface PERT-GANTT. Logo, análises qualitativas podem também ser consideradas, possibilitando que elementos de flexibilidade e adaptação estratégicas participem deste processo. Os resultados obtidos por esta metodologia, quando comparados aos métodos tradicionais, asseguram um planejamento estratégico de lavra que ao mesmo tempo que maximiza o valor presente líquido, delimitado pelas restrições operacionais e estratégias previamente adotadas, também é capaz de avaliar a sensibilidade do empreendimento às variações dos seus principais componentes, consequentemente, oferecendo maior segurança e correção ao processo decisório a este relacionado. / Strategic mine planning corresponds to the process to determine the best mine design and scheduling according to a previously stablished strategy. It is considered as a key element for the success of a mining venture, once supports the decision process related to it conduct and development. Conventional strategic mine planning methods are based on deterministics models, which are not capable to take into account the intrinsic variability related to it main components. Therefore, it can present results which are fairly distant from the reality and even compromise mine feasibility. Geological uncertainties are considered to be a major contributor to projects which fail to meet expectations. This study presents a comprehensive, multistage, mine planning methodology which utilizes conditional simulated models to address the risks and uncertainties associated with geological properties in order to measure, quantify and assess these factors throughout the mine planning process. This transfer function integrates and encompasses different quantitative analysis methods including graph theory, set theory, floating stopes and dynamic programming. Those are driven by risk measurements and the results are converted into mine activities whose final scheduling can be further refined in a PERT-GANTT interface. This also allows for qualitative analysis being undertaken in the final mine scheduling hence ensuring that operating flexibility and strategic adaptability could be also taken into account. The products obtained from this methodology, when compared with traditional methods, ensure that a strategic mine planning could achieve net present value maximization, constrained by operational elements and a strategy previously adopted, and at the same time it is also capable to evaluate the mine sensitivities according to it main components variation. Hence this methodology will offer and deliver higher safety and correction to the decision process associated to the mine venture.

Page generated in 0.1248 seconds