151 |
Methodology of visual knowledge discovery and its investigation / Vizualios žinių gavybos metodologija ir jos tyrimasBernatavičienė, Jolita 23 July 2008 (has links)
The research area of the thesis is the process of knowledge discovery from multidimensional data and the ways of improving the perception of the data investigated. Data perception is rather a complex problem, especially when the data refer to complicated object described by many parameters. In order to obtain exhaustive information on the analysed data, their all-round analysis is indispensable the stages of which are defined by the process of knowledge discovery. The object of dissertation research is the process of visual knowledge discovery. The following subjects are directly associated with this subject: formation of a primary set of multidimensional data; algorithms for clusterization, visualization, and classification; evaluation of the results obtained by data mining methods; mapping of a new multidimensional data; decision making and generalization of the knowledge obtained referring to the analysis results. The key target of the thesis is to develop and explore the methodology of knowledge discovery by visual methods that would allow us to increase the efficiency of data analysis. The research results of the work revealed new opportunities of medical (physiological) data analysis.
The dissertation is written in Lithuanian. It consists of 5 chapters, and the list of references. There are 116 pages of the text, 44 figures, 12 tables and
156 bibliographical sources.
The main results of this dissertation were published in 9 scientific papers:
1 article in a journal... [to full text] / Disertacijos tyrimų sritis yra žinių gavybos iš daugiamačių duomenų procesas ir tiriamų duomenų suvokimo gerinimo būdai. Duomenų suvokimas yra sudėtingas uždavinys, ypač kai duomenys nurodo sudėtingą objektą, kuris aprašytas daugeliu parametrų. Norint gauti išsamią informaciją apie analizuojamus duomenis būtina kompleksinė jų analizė, kurios etapus apibrėžia žinių gavybos procesas. Disertacijos tyrimų objektas – vizualios žinių gavybos procesas. Su šiuo objektu betarpiškai susiję dalykai: daugiamačių duomenų pirminės aibės suformavimas; klasterizavimo, vizualizavimo ir klasifikavimo algoritmai; duomenų gavybos metodais gautų rezultatų įvertinimas; naujų daugiamačių duomenų atvaizdavimas; sprendimų priėmimas ir gautų žinių apibendrinimas, atsižvelgiant į analizės rezultatus. Pagrindinis disertacijos tikslas yra sukurti ir ištirti žinių gavybos vizualiais metodais metodologiją, kuri leistų padidinti duomenų analizės efektyvumą. Darbe atliktų tyrimų rezultatai atskleidė naujas medicininių (fiziologinių) duomenų analizės galimybes.
Disertaciją sudaro penki skyriai ir literatūros sąrašas. Bendra disertacijos apimtis 116 puslapių, 44 paveikslai ir 12 lentelių.
Tyrimų rezultatai publikuoti 9 moksliniuose leidiniuose: 1 straipsnis leidinyje, įtrauktame į Mokslinės informacijos instituto pagrindinį (Thomson ISI Web of Science) sąrašą; 2 straipsniai leidiniuose, įtrauktuose į Mokslinės informacijos instituto konferencijos darbų (Thomson ISI Proceedings) duomenų bazę; 2 straipsniai... [toliau žr. visą tekstą]
|
152 |
Vizualios žinių gavybos metodologija ir jos tyrimas / Methodology of visual knowledge discovery and its investigationBernatavičienė, Jolita 30 September 2008 (has links)
Disertacijos tyrimų sritis yra žinių gavybos iš daugiamačių duomenų procesas ir tiriamų duomenų suvokimo gerinimo būdai. Duomenų suvokimas yra sudėtingas uždavinys, ypač kai duomenys nurodo sudėtingą objektą, kuris aprašytas daugeliu parametrų. Norint gauti išsamią informaciją apie analizuojamus duomenis būtina kompleksinė jų analizė, kurios etapus apibrėžia žinių gavybos procesas. Disertacijos tyrimų objektas – vizualios žinių gavybos procesas. Su šiuo objektu betarpiškai susiję dalykai: daugiamačių duomenų pirminės aibės suformavimas; klasterizavimo, vizualizavimo ir klasifikavimo algoritmai; duomenų gavybos metodais gautų rezultatų įvertinimas; naujų daugiamačių duomenų atvaizdavimas; sprendimų priėmimas ir gautų žinių apibendrinimas, atsižvelgiant į analizės rezultatus. Pagrindinis disertacijos tikslas yra sukurti ir ištirti žinių gavybos vizualiais metodais metodologiją, kuri leistų padidinti duomenų analizės efektyvumą. Darbe atliktų tyrimų rezultatai atskleidė naujas medicininių (fiziologinių) duomenų analizės galimybes.
Disertaciją sudaro penki skyriai ir literatūros sąrašas. Bendra disertacijos apimtis 116 puslapių, 44 paveikslai ir 12 lentelių.
Tyrimų rezultatai publikuoti 9 moksliniuose leidiniuose: 1 straipsnis leidinyje, įtrauktame į Mokslinės informacijos instituto pagrindinį (Thomson ISI Web of Science) sąrašą; 2 straipsniai leidiniuose, įtrauktuose į Mokslinės informacijos instituto konferencijos darbų (Thomson ISI Proceedings) duomenų bazę; 2 straipsniai... [toliau žr. visą tekstą] / The research area of the thesis is the process of knowledge discovery from multidimensional data and the ways of improving the perception of the data investigated. Data perception is rather a complex problem, especially when the data refer to complicated object described by many parameters. In order to obtain exhaustive information on the analysed data, their all-round analysis is indispensable the stages of which are defined by the process of knowledge discovery. The object of dissertation research is the process of visual knowledge discovery. The following subjects are directly associated with this subject: formation of a primary set of multidimensional data; algorithms for clusterization, visualization, and classification; evaluation of the results obtained by data mining methods; mapping of a new multidimensional data; decision making and generalization of the knowledge obtained referring to the analysis results. The key target of the thesis is to develop and explore the methodology of knowledge discovery by visual methods that would allow us to increase the efficiency of data analysis. The research results of the work revealed new opportunities of medical (physiological) data analysis.
The dissertation is written in Lithuanian. It consists of 5 chapters, and the list of references. There are 116 pages of the text, 44 figures, 12 tables and
156 bibliographical sources.
The main results of this dissertation were published in 9 scientific papers:
1 article in a journal... [to full text]
|
153 |
Verslo žinių išgavimo iš egzistuojančių programų sistemų tyrimas / Business Knowledge Extraction from Existing Software SystemsNormantas, Kęstutis 16 January 2014 (has links)
Darbe nagrinėjama programų sistemų palaikymo ir vystymo problema. Nustatyta, jog sąnaudos šiose programų sistemos gyvavimo ciklo fazėse siekia iki 80% visų sąnaudų, skiriamų programų sistemai kurti. Pagrindinis šio reiškinio veiksnys yra nuolatinis poreikis pritaikyti sistemų funkcionalumą prie besikeičiančių verslo reikalavimų, o tokios užduotys apima didžiąją dalį visų palaikymo veiklų. Nagrinėti tyrimai parodė, kad programų sistemose įgyvendintai verslo logikai suprasti sugaištama 40–60% pakeitimams atliki skirto laiko, kadangi atsakingi už sistemų palaikymą žmonės paprastai nėra jų projektuotai, todėl turi dėti dideles pastangas, kad išsiaiškintų sistemos veikimo principus. Be to, pakeitimai, atliekami palaikymo metu, yra retai dokumentuojami (ar net nedokumentuojami visai), o supratimas įgytas įgyvendinant pakeitimus lieka individualių programuotojų galvose. Tuo tarpu kiti tyrimai atskleidė, jog paprastai tik trečdalis programų sistemos kodo įgyvendina verslo logiką, o kita dalis yra skirta platformos ir infrastruktūros funkcijoms įgyvendinti. Iš to darytina išvada, jog išgaunant dalykinės srities žinias bei išlaikant atsekamumą tarp jų ir jas įgyvendinančio programinio kodo, galima sumažinti sistemų palaikymo ir vystymo kaštus. Todėl pagrindinis šio darbo tikslas yra patobulinti verslo žinių išgavimo ir vaizdavimo procesą, pasiūlant metodą ir palaikančias priemones, kurios palengvintų egzistuojančių programų sistemų suvokimą.
Darbas susideda iš įvado, 4 dalių, bendrųjų... [toliau žr. visą tekstą] / The dissertation addresses the problem of software maintenance and evolution. It identifies that spending within these software lifecycle phases may account for up to 80% of software’s total lifecycle cost, whereas the inability to adopt software quickly and reliably to meet ever-changing business requirements may lead to business opportunities being lost. The main reason of this phenomenon is the fact that the most of maintenance effort is devoted to understanding the software to be modified. On the other hand, related studies show that less than one-third of software source code contains business logic implemented within it, while the remaining part is intended for platform or infrastructure relevant activities. It follows that if the most of changes in software are made due to the need to adopt its functionality to changed business requirements, then facilitating software comprehension with automated business knowledge extraction methods may significantly reduce the cost of software maintenance and evolution. Therefore the main goal of this thesis is to improve business knowledge extraction process by proposing a method and supporting tool framework that would facilitate comprehension of existing software systems.
The dissertation consists of the following parts: Introduction, 4 chapters, General Conclusions, References, and 6 Annexes.
Chapter 1 presents a systematic literature review of related studies in order to summarize the state-of-the art in this research field... [to full text]
|
154 |
Using information technology to support the discovery of novel knowledge in organizationsJenkin, Tracy A. 27 August 2008 (has links)
In this dissertation, I examine how IT can support individuals, and in turn their organizations, in learning about and knowing their external environment on the Web. Specifically, I examine novel-knowledge discovery in the context of the multi-level organizational learning process, focusing on cognitive developments and changes to mental models. Novel knowledge is defined as knowledge that is potentially strategically important to the organization, not currently known to the organization, indirectly relevant and therefore difficult to find. Novel knowledge is proposed to be one of three different types of knowledge that organizations seek to discover in their environment. A theoretical framework is developed to identify the sets of tool characteristics, collectively referred to as levels, which are proposed to support the discovery of different types of knowledge, as well as different modes of learning and learning processes. In addition, extensions to the 4I organizational learning process model are proposed, specific to searching and learning on the Web: 1) adding a fifth process – information foraging and search-term development, and 2) adding a fourth level to the learning process – the machine-level. A competing theories approach is used to develop a rich understanding of knowledge discovery and learning on the Web. Understanding which types of tools are useful in different learning contexts has implications for learning effectiveness and may help firms understand how to “manage” their learning. Tools for the discovery of highly novel knowledge are less prevalent than tools to support the other levels of knowledge discovery. Accordingly, a design theory for novel-knowledge discovery tools is proposed based on organizational learning theories. An instantiation of the design theory, a novel-knowledge discovery tool, is developed and tested within the organizational learning process and compared to tools at the other two levels of knowledge discovery. In addition, different processes involved in using a novel-knowledge discovery tool at the group level are examined. Three separate studies were conducted, including a lab and field experiment, and case study. The results are proposed to demonstrate how novel-knowledge discovery tools can support organizational learning. / Thesis (Ph.D, Management) -- Queen's University, 2008-08-26 09:25:31.367
|
155 |
Fuzzy Spatial Data Cube Construction And Its Use In Association Rule MiningIsik, Narin 01 June 2005 (has links) (PDF)
The popularity of spatial databases increases since the amount of the spatial data that need to be handled has increased by the use of digital maps, images from satellites, video cameras, medical equipment, sensor networks, etc. Spatial data are difficult to examine and extract interesting knowledge / hence, applications that assist decision-making about spatial data like weather forecasting, traffic supervision, mobile communication, etc. have been introduced. In this thesis, more natural and precise knowledge from spatial data is generated by construction of fuzzy spatial data cube and extraction of fuzzy association rules from it in order to improve decision-making about spatial data. This involves an extensive research about spatial knowledge discovery and how fuzzy logic can be used to develop it. It is stated that incorporating fuzzy logic to spatial data cube construction necessitates a new method for aggregation of fuzzy spatial data. We illustrate how this method also enhances the meaning of fuzzy spatial generalization rules and fuzzy association rules with a case-study about weather pattern searching. This study contributes to spatial knowledge discovery by generating more understandable and interesting knowledge from spatial data by extending spatial generalization with fuzzy memberships, extending the spatial aggregation in spatial data cube construction by utilizing weighted measures, and generating fuzzy association rules from the constructed fuzzy spatial data cube.
|
156 |
Aplicação do processo de descoberta de conhecimento em dados do poder judiciário do estado do Rio Grande do Sul / Applying the Knowledge Discovery in Database (KDD) Process to Data of the Judiciary Power of Rio Grande do SulSchneider, Luís Felipe January 2003 (has links)
Para explorar as relações existentes entre os dados abriu-se espaço para a procura de conhecimento e informações úteis não conhecidas, a partir de grandes conjuntos de dados armazenados. A este campo deu-se o nome de Descoberta de Conhecimento em Base de Dados (DCBD), o qual foi formalizado em 1989. O DCBD é composto por um processo de etapas ou fases, de natureza iterativa e interativa. Este trabalho baseou-se na metodologia CRISP-DM . Independente da metodologia empregada, este processo tem uma fase que pode ser considerada o núcleo da DCBD, a “mineração de dados” (ou modelagem conforme CRISP-DM), a qual está associado o conceito “classe de tipo de problema”, bem como as técnicas e algoritmos que podem ser empregados em uma aplicação de DCBD. Destacaremos as classes associação e agrupamento, as técnicas associadas a estas classes, e os algoritmos Apriori e K-médias. Toda esta contextualização estará compreendida na ferramenta de mineração de dados escolhida, Weka (Waikato Environment for Knowledge Analysis). O plano de pesquisa está centrado em aplicar o processo de DCBD no Poder Judiciário no que se refere a sua atividade fim, julgamentos de processos, procurando por descobertas a partir da influência da classificação processual em relação à incidência de processos, ao tempo de tramitação, aos tipos de sentenças proferidas e a presença da audiência. Também, será explorada a procura por perfis de réus, nos processos criminais, segundo características como sexo, estado civil, grau de instrução, profissão e raça. O trabalho apresenta nos capítulos 2 e 3 o embasamento teórico de DCBC, detalhando a metodologia CRISP-DM. No capítulo 4 explora-se toda a aplicação realizada nos dados do Poder Judiciário e por fim, no capítulo 5, são apresentadas as conclusões. / With the purpose of exploring existing connections among data, a space has been created for the search of Knowledge an useful unknown information based on large sets of stored data. This field was dubbed Knowledge Discovery in Databases (KDD) and it was formalized in 1989. The KDD consists of a process made up of iterative and interactive stages or phases. This work was based on the CRISP-DM methodology. Regardless of the methodology used, this process features a phase that may be considered as the nucleus of KDD, the “data mining” (or modeling according to CRISP-DM) which is associated with the task, as well as the techniques and algorithms that may be employed in an application of KDD. What will be highlighted in this study is affinity grouping and clustering, techniques associated with these tasks and Apriori and K-means algorithms. All this contextualization will be embodied in the selected data mining tool, Weka (Waikato Environment for Knowledge Analysis). The research plan focuses on the application of the KDD process in the Judiciary Power regarding its related activity, court proceedings, seeking findings based on the influence of the procedural classification concerning the incidence of proceedings, the proceduring time, the kind of sentences pronounced and hearing attendance. Also, the search for defendants’ profiles in criminal proceedings such as sex, marital status, education background, professional and race. In chapters 2 and 3, the study presents the theoretical grounds of KDD, explaining the CRISP-DM methodology. Chapter 4 explores all the application preformed in the data of the Judiciary Power, and lastly, in Chapter conclusions are drawn
|
157 |
Ciência, mídia e governo na configuração do macroambiente para os biocombustíveis líquidosTalamini, Edson January 2008 (has links)
O objetivo na pesquisa foi investigar as dimensões sob as quais a Ciência, a Mídia e o Governo de diferentes países configuraram o macroambiente para os biocombustíveis líquidos ao longo do tempo. Utilizando a Teoria da Análise Ambiental, da área de planejamento estratégico, e as teorias da área da comunicação (Agendamento, Enquadramento e Priming), apoiando-se numa revisão das interações entre Ciência, Mídia e Governo, foram definidas nove dimensões macroambientais, sob as quais a temática dos biocombustíveis líquidos pode ser enquadrada: Agronômica, Ambiental, Cultural, Econômica, Geopolítica, Legal, Política, Social e Tecnológica. Neste estudo, foram formulados seis conjuntos de hipóteses, na investigação das semelhanças e diferenças entre os meios de expressão de um mesmo país e entre os diferentes países. Como espaços geopolíticos de estudo, foram selecionados os três países maiores produtores de biocombustíveis líquidos no presente: Alemanha, Brasil e Estados Unidos. Para análise, foram coletados documentos textuais em formato eletrônico de cada país ao longo de dez anos (1997 a 2006). A busca dos documentos foi feita em bases de publicações científicas, em páginas dos governos na rede mundial de computadores e em arquivos eletrônicos dos jornais selecionados, a partir de palavras-chave relacionadas aos tipos de biocombustíveis líquidos mais importantes no presente. Os 9.343 documentos selecionados foram armazenados em nove bases de dados, construídas e preparadas utilizando-se o software QDA Miner. Para extrair o conhecimento das bases textuais, foi elaborada uma estrutura de análise constituída pelas dimensões macroambientais e os seus respectivos conjuntos de “palavras-d”, as quais foram definidas a partir da sua freqüência de uso em publicações científicas dos campos do conhecimento, respectivos a cada dimensão. Aplicando-se a estrutura de análise ao módulo WordStat® do software SimStat®, foi feita a Mineração em Textos nas bases de dados. As hipóteses de semelhança ou diferença entre as respectivas expressões em cada dimensão, em cada tipo de documento e em cada país foram testadas por meio de Testes de Aderência e Homogeneidade, além do uso do Coeficiente de Similaridade de Jaccard. Os resultados mostraram que as dimensões macroambientais predominantes, sob as quais a temática dos biocombustíveis líquidos tem se expressado de modo similar na Ciência dos três países, são: Ambiental, Tecnológica e Agronômica. Nos documentos do Governo da Alemanha predominaram as dimensões: Tecnológica, Geopolítica e Ambiental, enquanto que nos documentos do Governo do Brasil predominaram as dimensões: Tecnológica, Geopolítica, Econômica e Ambiental, com amplo domínio da dimensão Tecnológica. Por outro lado, nos documentos do Governo dos Estados Unidos, predominaram as dimensões: Ambiental, Tecnológica e Agronômica. Com relação aos resultados observados nos documentos da Mídia alemã predominaram as dimensões: Geopolítica, Econômica e Agronômica. Na Mídia brasileira predominaram as dimensões: Econômica, Tecnológica, Política e Geopolítica. Na Mídia norte-americana predominaram as dimensões: Econômica, Ambiental, Geopolítica e Política. Os resultados indicam a existência de diferenças entre a Ciência, a Mídia e o Governo de cada país analisado, sendo que o grau de similaridade é maior entre as expressões da Ciência e dos Governos. Assim, a produção e o uso dos biocombustíveis líquidos evoluem num macroambiente determinado por vetores de diferentes dimensões dominantes, de acordo com as particularidades de cada espaço geopolítico. O reconhecimento destas diferenças pode ter ser relevante para o desenho de estratégias para a promoção da produção e do uso de biocombustíveis líquidos nos diferentes países e mercados. / The objective of this research was to investigate the dimensions in which Science, Media and Government of different countries determined the macroenvironment in which liquid biofuel production and use evolved during time. By applying the Environmental Analysis Theory, from the field of strategic planning, and theories of the field of the communication sciences (Agenda Setting, Framing and Priming), supported by a review of the interactions between Science, Media and Government, nine macrodimensions were defined, in which the subject of liquid biofuels production and use can be framed: agronomic, environmental, cultural, economic, geopolitical, legal, political, social and technological. In this study, six group of hypothesis were presented for the test for similarities and differences between the different vehicles of expression of the same or of different countries. For the study of different geopolitical spaces, the three countries which currently present the highest production of liquid biofuels were selected namely Germany, Brazil and the United States. For analysis, electronic text documents were selected from each country, published during ten years (from 1997 to 2006). The search for documents was carried out in bases of scientific publications and in websites of governments and of selected newspapers, using keywords related to the liquid biofuels mostly used currently. The 9,343 documents selected were downloaded onto nine data-bases, formatted by the QDA Miner software. For knowledge extraction from textual data-bases, a structural analysis framework was constructed considering the nine macroenvironmental dimensions selected and the sets of corresponding “d-words”, as derived from collections of scientific publications of each of the fields of knowledge, respectively to each dimension. Text mining was carried out in the data-bases, according to the analytical framework with the help of WordStat® module of the software SimSat®. The similarity or difference hypothesis between the respective expressions in each dimension, in each kind of document, and in each country, were verified by the Adherence and Homogeneity Test and by determination of the Jaccard’s Similarity Coefficient. Results showed that the predominant macroenvironmental dimensions, in which the subject of liquid biofuels has been expressed in Science documents, similarly in the three countries studied, are: Environmental, Technological and Agronomic. In the documents of the Government of Germany predominated the dimensions: Technological, Geopolitical and Environmental, whereas in the documents of the Government of Brazil predominated the dimensions: Technological, Geopolitical, Economic and Environmental, with ample dominance of the Technological dimension. On the other hand, in the documents of the Government of the United States predominated the dimensions: Environmental, Technological and Agronomic. Regarding the documental analysis of the Media, in the German Media predominated the dimensions: Geopolitical, Economic and Agronomic. In the Brazilian Media predominated the dimensions: Economic, Technological, Political and Geopolitical. In the North-American Media predominated the dimensions: Economic, Environmental, Geopolitical, and Political. The results indicate the occurrence of differences between Science, Media and Government of each country analysed, the degree of similarity being higher in the expressions of Science and Government. Therefore, the production and the use of liquid biofuels evolve in a macroenvironment determined by different, dominant macroenvironmental vectors, according to the singularities of each particular geopolitical space. The recognition of these differences can be of relevance for designing strategies for the promotion of production and use of liquid biofuels in different countries and markets.
|
158 |
Teorias sociais implícitas nos índices e sistemas de indicadores: uma contribuição estatística ao estudo do desenvolvimentoSoares Júnior, Jair Sampaio January 2010 (has links)
Submitted by Tatiana Lima (tatianasl@ufba.br) on 2015-03-23T19:53:51Z
No. of bitstreams: 1
Soares Júnior, Jair Sampaio.pdf: 3716316 bytes, checksum: 0ed464d1e2ef44d783c119d942d5b049 (MD5) / Approved for entry into archive by Tatiana Lima (tatianasl@ufba.br) on 2015-04-06T17:55:50Z (GMT) No. of bitstreams: 1
Soares Júnior, Jair Sampaio.pdf: 3716316 bytes, checksum: 0ed464d1e2ef44d783c119d942d5b049 (MD5) / Made available in DSpace on 2015-04-06T17:55:50Z (GMT). No. of bitstreams: 1
Soares Júnior, Jair Sampaio.pdf: 3716316 bytes, checksum: 0ed464d1e2ef44d783c119d942d5b049 (MD5) / Dados públicos armazenados, nunca antes disponibilizados à população, hoje podem ser acessados livremente através da Internet. Paralelamente, impulsionado pelo aumento da capacidade computacional de armazenamento e processamento de dados, o Knowledge Discovery in Databases – KDD tem se tornado um método amplamente discutido para extração de conhecimento das bases públicas de dados. Este trabalho se propõe a contribuir para o estudo do desenvolvimento humano ao avaliar o potencial do KDD como método a ser
empregado na mensuração do desenvolvimento social a partir de informações públicas. Por outro lado, a evolução do pensamento científico sobre o desenvolvimento converge cada vez mais para uma percepção transdisciplinar, complexa e intangível. Nessa perspectiva, os atuais métodos utilizados na construção de índices e sistemas de indicadores sociais, mostram-se insuficientes para representar o fenômeno e o KDD destaca-se em meio ao estado da arte das tecnologias de pesquisa empregadas no estudo desse tema como um método promissor, uma vez que contempla a modelagem de conceitos sociais e permite identificar e mensurar diversas relações entre os fatores associados ao fenômeno. A partir da teoria das medições, que se baseia na filosofia da ciência e na estatística, são exploradas as potencialidades analíticas do método na elaboração de índices sociais, tanto em nível teórico-metodológico – em que se discutem os construtos, modelos e indicadores – quanto em nível prático, através da sua aplicação ao contexto do desenvolvimento social no Brasil. Para isso, no nível teóricometodológico,
são analisados quarenta e três dos mais conhecidos trabalhos nacionais e
internacionais utilizados na mensuração do desenvolvimento social. No nível prático, são utilizados dados públicos do Instituto Brasileiro de Geografia e Estatística, Ministério da Saúde, Ministério da Educação e Ministério da Justiça de todos os 5.560 municípios brasileiros. Os resultados da pesquisa apontam que, de fato, o KDD apresenta-se como um método com grande potencial analítico em relação aos métodos tradicionais, revelando-se,
também, como adequado à abordagem multivariada do fenômeno, uma vez que é capaz de refletir, na esfera das investigações da realidade social, a complexidade do fenômeno, em afinidade com as formulações teóricas mais recentes. Public data stored, never before available to the population today can be accessed freely via the Internet. In parallel, driven by increased computing storage and processing of data, Knowledge Discovery in Databases - KDD has become a widely discussed method for extracting knowledge from the public databases. This paper aims to contribute to the study of human development to assess the potential of KDD as a method to be employed in the
measurement of social development from public information. Moreover, the evolution of scientific thinking on development converges increasingly to a perception disciplinary, complex and intangible. From this perspective, the current methods used in the construction
of indexes and systems of social indicators, to be insufficient to represent the phenomenon and KDD stands out amid the state of the art search technologies employed to study this
subject as a promising method, since it includes the modeling of social concepts and to identify and measure various relationships between factors associated with the phenomenon. From the theory of measurement based on philosophy of science and statistics, are exploring the potential of the analytical method in developing social indicators, both in theoretical and methodological - in which we discuss the constructs, models and indicators - as on a practical level, through its application to the context of social development in Brazil. For this, the theoretical and methodological, are analyzed Forty-three of the best known national and international work used in the measurement of social development. On a practical level, are used public data from the Brazilian Institute of Geography and Statistics, Ministry of Health,
Ministry of Education and Ministry of Justice in all 5,560 Brazilian cities. The survey results indicate that, in fact, the KDD is presented as an analytical method with great potential in relation to traditional methods, revealing, too, as appropriate to the multivariate approach the phenomenon, since it is capable of reflecting, in the sphere of research of social reality, the complexity of the phenomenon, in affinity with the more recent theoretical formulations.
|
159 |
Ciência, mídia e governo na configuração do macroambiente para os biocombustíveis líquidosTalamini, Edson January 2008 (has links)
O objetivo na pesquisa foi investigar as dimensões sob as quais a Ciência, a Mídia e o Governo de diferentes países configuraram o macroambiente para os biocombustíveis líquidos ao longo do tempo. Utilizando a Teoria da Análise Ambiental, da área de planejamento estratégico, e as teorias da área da comunicação (Agendamento, Enquadramento e Priming), apoiando-se numa revisão das interações entre Ciência, Mídia e Governo, foram definidas nove dimensões macroambientais, sob as quais a temática dos biocombustíveis líquidos pode ser enquadrada: Agronômica, Ambiental, Cultural, Econômica, Geopolítica, Legal, Política, Social e Tecnológica. Neste estudo, foram formulados seis conjuntos de hipóteses, na investigação das semelhanças e diferenças entre os meios de expressão de um mesmo país e entre os diferentes países. Como espaços geopolíticos de estudo, foram selecionados os três países maiores produtores de biocombustíveis líquidos no presente: Alemanha, Brasil e Estados Unidos. Para análise, foram coletados documentos textuais em formato eletrônico de cada país ao longo de dez anos (1997 a 2006). A busca dos documentos foi feita em bases de publicações científicas, em páginas dos governos na rede mundial de computadores e em arquivos eletrônicos dos jornais selecionados, a partir de palavras-chave relacionadas aos tipos de biocombustíveis líquidos mais importantes no presente. Os 9.343 documentos selecionados foram armazenados em nove bases de dados, construídas e preparadas utilizando-se o software QDA Miner. Para extrair o conhecimento das bases textuais, foi elaborada uma estrutura de análise constituída pelas dimensões macroambientais e os seus respectivos conjuntos de “palavras-d”, as quais foram definidas a partir da sua freqüência de uso em publicações científicas dos campos do conhecimento, respectivos a cada dimensão. Aplicando-se a estrutura de análise ao módulo WordStat® do software SimStat®, foi feita a Mineração em Textos nas bases de dados. As hipóteses de semelhança ou diferença entre as respectivas expressões em cada dimensão, em cada tipo de documento e em cada país foram testadas por meio de Testes de Aderência e Homogeneidade, além do uso do Coeficiente de Similaridade de Jaccard. Os resultados mostraram que as dimensões macroambientais predominantes, sob as quais a temática dos biocombustíveis líquidos tem se expressado de modo similar na Ciência dos três países, são: Ambiental, Tecnológica e Agronômica. Nos documentos do Governo da Alemanha predominaram as dimensões: Tecnológica, Geopolítica e Ambiental, enquanto que nos documentos do Governo do Brasil predominaram as dimensões: Tecnológica, Geopolítica, Econômica e Ambiental, com amplo domínio da dimensão Tecnológica. Por outro lado, nos documentos do Governo dos Estados Unidos, predominaram as dimensões: Ambiental, Tecnológica e Agronômica. Com relação aos resultados observados nos documentos da Mídia alemã predominaram as dimensões: Geopolítica, Econômica e Agronômica. Na Mídia brasileira predominaram as dimensões: Econômica, Tecnológica, Política e Geopolítica. Na Mídia norte-americana predominaram as dimensões: Econômica, Ambiental, Geopolítica e Política. Os resultados indicam a existência de diferenças entre a Ciência, a Mídia e o Governo de cada país analisado, sendo que o grau de similaridade é maior entre as expressões da Ciência e dos Governos. Assim, a produção e o uso dos biocombustíveis líquidos evoluem num macroambiente determinado por vetores de diferentes dimensões dominantes, de acordo com as particularidades de cada espaço geopolítico. O reconhecimento destas diferenças pode ter ser relevante para o desenho de estratégias para a promoção da produção e do uso de biocombustíveis líquidos nos diferentes países e mercados. / The objective of this research was to investigate the dimensions in which Science, Media and Government of different countries determined the macroenvironment in which liquid biofuel production and use evolved during time. By applying the Environmental Analysis Theory, from the field of strategic planning, and theories of the field of the communication sciences (Agenda Setting, Framing and Priming), supported by a review of the interactions between Science, Media and Government, nine macrodimensions were defined, in which the subject of liquid biofuels production and use can be framed: agronomic, environmental, cultural, economic, geopolitical, legal, political, social and technological. In this study, six group of hypothesis were presented for the test for similarities and differences between the different vehicles of expression of the same or of different countries. For the study of different geopolitical spaces, the three countries which currently present the highest production of liquid biofuels were selected namely Germany, Brazil and the United States. For analysis, electronic text documents were selected from each country, published during ten years (from 1997 to 2006). The search for documents was carried out in bases of scientific publications and in websites of governments and of selected newspapers, using keywords related to the liquid biofuels mostly used currently. The 9,343 documents selected were downloaded onto nine data-bases, formatted by the QDA Miner software. For knowledge extraction from textual data-bases, a structural analysis framework was constructed considering the nine macroenvironmental dimensions selected and the sets of corresponding “d-words”, as derived from collections of scientific publications of each of the fields of knowledge, respectively to each dimension. Text mining was carried out in the data-bases, according to the analytical framework with the help of WordStat® module of the software SimSat®. The similarity or difference hypothesis between the respective expressions in each dimension, in each kind of document, and in each country, were verified by the Adherence and Homogeneity Test and by determination of the Jaccard’s Similarity Coefficient. Results showed that the predominant macroenvironmental dimensions, in which the subject of liquid biofuels has been expressed in Science documents, similarly in the three countries studied, are: Environmental, Technological and Agronomic. In the documents of the Government of Germany predominated the dimensions: Technological, Geopolitical and Environmental, whereas in the documents of the Government of Brazil predominated the dimensions: Technological, Geopolitical, Economic and Environmental, with ample dominance of the Technological dimension. On the other hand, in the documents of the Government of the United States predominated the dimensions: Environmental, Technological and Agronomic. Regarding the documental analysis of the Media, in the German Media predominated the dimensions: Geopolitical, Economic and Agronomic. In the Brazilian Media predominated the dimensions: Economic, Technological, Political and Geopolitical. In the North-American Media predominated the dimensions: Economic, Environmental, Geopolitical, and Political. The results indicate the occurrence of differences between Science, Media and Government of each country analysed, the degree of similarity being higher in the expressions of Science and Government. Therefore, the production and the use of liquid biofuels evolve in a macroenvironment determined by different, dominant macroenvironmental vectors, according to the singularities of each particular geopolitical space. The recognition of these differences can be of relevance for designing strategies for the promotion of production and use of liquid biofuels in different countries and markets.
|
160 |
Mineração de interesses no processo de modernização dirigida a arquiteturaSantibáñez, Daniel Gustavo San Martín 27 August 2013 (has links)
Made available in DSpace on 2016-06-02T19:06:09Z (GMT). No. of bitstreams: 1
5515.pdf: 2859644 bytes, checksum: 8f2473af784eb07ff38067a957051dde (MD5)
Previous issue date: 2013-08-27 / Universidade Federal de Sao Carlos / Software systems are considered legacy when they were developed many years ago with outdated technologies and their maintenance process consumes a large amount of resources. One cause of these problems is the inadequate modularization of its crosscutting concerns. In this situation, an alternative is to modernize the system with a new language to provide better support for concern modularization. ADM (Architecture-Driven Modernization) is an OMG model-driven proposal to modernize legacy systems and consist of a set of metamodels in which the main metamodel is KDM (Knowledge Discovery Metamodel), which allows to represent all the characteristics of a system. The modernization process begins with reverse engineering to represent the legacy system in a KDM model. Thereafter, refactorings can be applied to the model and then generate the modernized code. However, the current proposals do not support crosscutting concerns modularization. This occurs because the first step is to identify the elements which contribute with the implementation of a particular concern and it is not supplied by ADM. In this sense, this dissertation presents an approach for mining crosscutting concerns in KDM models, thus establishing the first step towards to a Concern-Driven modernization. The approach is a combination of two techniques, a concern library and a modified K-means clustering algorithm, which comprises four steps where the input is a KDM model and the result is the same KDM model with annotated concerns and some log files. In addition, we developed an Eclipse plugin called CCKDM to implement the approach. An evaluation was performed involving three software systems. The results show that for systems using APIs to implement their concerns the developed technique is an effective method for identifying them, achieving good values of precision and recall. / Sistemas de software são considerados legados quando foram desenvolvidos há muitos anos com tecnologias obsoletas e seu processo de manutenção consome uma quantidade de recursos além da desejada. Uma das causas desses problemas é a modularização inadequada de seus interesses transversais. Quando se encontram nessa situação, uma alternativa é modernizar o sistema para novas linguagens que forneçam melhor suporte à modularização desse tipo de interesse. A ADM (Architecture-Driven Modernization) é uma proposta do OMG para a modernização orientada a modelos de sistemas legados, sendo composta por um conjunto de metamodelos, em que o principal é o KDM (Knowledge Discovery Metamodel), que permite representar todas as particularidades de um sistema. O processo de modernização inicia-se com a engenharia reversa, em que o sistema legado é inteiramente representado em KDM. Depois disso, pode-se aplicar refatorações nesse modelo e gerar o código modernizado. Entretanto, a proposta atual da ADM não inclui suporte para modularizar interesses transversais de um sistema. Isso ocorre porque o primeiro passo desse processo é minerar e encontrar os elementos que contribuem para a implementação de um dado interesse, e isso não é fornecido pela ADM. Nesse sentido, nesta dissertação é apresentada uma abordagem para mineração de interesses no metamodelo KDM, estabelecendo o primeiro passo para um processo de modernização dirigido a interesses. A abordagem de mineração proposta atua com uma combinação de duas técnicas; uma biblioteca de interesses e um algoritmo modificado K-means para agrupar strings similares. A abordagem inclui quatro passos onde a entrada é um modelo KDM e o resultado é o mesmo modelo KDM com os interesses anotados e mais alguns arquivos de registro. Além disso, desenvolveuse um plugin chamado CCKDM para o ambiente Eclipse que implementa a abordagem. Uma avaliação foi realizada envolvendo três sistemas de software. Os resultados da avaliação mostraram que para sistemas que utilizam APIs para implementar seus interesses a técnica desenvolvida é efetiva para a identificação deles, atingindo bons valores de precisão e cobertura.
|
Page generated in 0.3274 seconds