41 |
Inferência de redes gênicas por agrupamento, busca exaustiva e análise de predição intrinsecamente multivariada. / Gene networks inference by clustering, exhaustive search and intrinsically multivariate prediction analysis.Jacomini, Ricardo de Souza 09 June 2017 (has links)
A inferência de redes gênicas (GN) a partir de dados de expressão gênica temporal é um problema crucial e desafiador em Biologia Sistêmica. Os conjuntos de dados de expressão geralmente consistem em dezenas de amostras temporais e as redes consistem em milhares de genes, tornando inúmeros métodos de inferência inviáveis na prática. Para melhorar a escalabilidade dos métodos de inferência de GNs, esta tese propõe um arcabouço chamado GeNICE, baseado no modelo de redes gênicas probabilísticas. A principal novidade é a introdução de um procedimento de agrupamento de genes, com perfis de expressão relacionados, para fornecer uma solução aproximada com complexidade computacional reduzida. Os agrupamentos definidos são usados para reduzir a dimensionalidade permitindo uma busca exaustiva mais eficiente pelos melhores subconjuntos de genes preditores para cada gene alvo de acordo com funções critério multivariadas. GeNICE reduz consideravelmente o espaço de busca porque os candidatos a preditores ficam restritos a um gene representante por agrupamento. No final, uma análise multivariada é realizada para cada subconjunto preditor definido, visando recuperar subconjuntos mínimos para simplificar a rede gênica inferida. Em experimentos com conjuntos de dados sintéticos, GeNICE obteve uma redução substancial de tempo quando comparado a uma solução anterior sem a etapa de agrupamento, preservando a precisão da predição de expressão gênica mesmo quando o número de agrupamentos é pequeno (cerca de cinquenta) e o número de genes é grande (ordem de milhares). Para um conjunto de dados reais de microarrays de Plasmodium falciparum, a precisão da predição alcançada pelo GeNICE foi de aproximadamente 97% em média. As redes inferidas para os genes alvos da glicólise e do apicoplasto refletem propriedades topológicas de redes complexas do tipo \"mundo pequeno\" e \"livre de escala\", para os quais grande parte das conexões são estabelecidas entre os genes de um mesmo módulo e algumas poucas conexões fazem o papel de estabelecer uma ponte entre os módulos (redes mundo pequeno), e o grau de distribuição das conexões entre os genes segue uma lei de potência, na qual a maioria dos genes têm poucas conexões e poucos genes (hubs) apresentam um elevado número de conexões (redes livres de escala), como esperado. / Gene network (GN) inference from temporal gene expression data is a crucial and challenging problem in Systems Biology. Expression datasets usually consist of dozens of temporal samples, while networks consist of thousands of genes, thus rendering many inference methods unfeasible in practice. To improve the scalability of GN inference methods, this work proposes a framework called GeNICE, based on Probabilistic Gene Networks; the main novelty is the introduction of a clustering procedure to group genes with related expression profiles, to provide an approximate solution with reduced computational complexity. The defined clusters were used to perform an exhaustive search to retrieve the best predictor gene subsets for each target gene, according to multivariate criterion functions. GeNICE greatly reduces the search space because predictor candidates are restricted to one representative gene per cluster. Finally, a multivariate analysis is performed for each defined predictor subset to retrieve minimal subsets and to simplify the network. In experiments with in silico generated datasets, GeNICE achieved substantial computational time reduction when compared to an existing solution without the clustering step, while preserving the gene expression prediction accuracy even when the number of clusters is small (about fifty) relative to the number of genes (order of thousands). For a Plasmodium falciparum microarray dataset, the prediction accuracy achieved by GeNICE was roughly 97% on average. The inferred networks for the apicoplast and glycolytic target genes reflects the topological properties of \"small-world\"and \"scale-free\"complex network models in which a large part of the connections is established between genes of the same functional module (smallworld networks) and the degree distribution of the connections between genes tends to form a power law, in which most genes present few connections and few genes (hubs) present a large number of connections (scale-free networks), as expected.
|
42 |
Estimação não-paramétrica e semi-paramétrica de fronteiras de produçãoTorrent, Hudson da Silva January 2010 (has links)
Existe uma grande e crescente literatura sobre especificação e estimação de fronteiras de produção e, portanto, de eficiência de unidades produtivas. Nesta tese, o foco esta sobre modelos de fronteiras determinísticas, os quais são baseados na hipótese de que os dados observados pertencem ao conjunto tecnológico. Dentre os modelos estatísticos e estimadores para fronteiras determinísticas existentes, uma abordagem promissora e a adotada por Martins-Filho e Yao (2007). Esses autores propõem um procedimento de estimação composto por três estágios. Esse estimador e de fácil implementação, visto que envolve procedimentos não-paramétricos bem conhecidos. Além disso, o estimador possui características desejáveis vis-à-vis estimadores para fronteiras determinísticas tradicionais como DEA e FDH. Nesta tese, três artigos, que melhoram o modelo proposto por Martins-Filho e Yao (2007), sao propostos. No primeiro artigo, o procedimento de estimação desses autores e melhorado a partir de uma variação do estimador exponencial local, proposto por Ziegelmann (2002). Demonstra-se que estimador proposto a consistente e assintoticamente normal. Além disso, devido ao estimador exponencial local, estimativas potencialmente negativas para a função de variância condicional, que poderiam prejudicar a aplicabilidade do estimador proposto por Martins-Filho e Yao, são evitadas. No segundo artigo, e proposto um método original para estimação de fronteiras de produção em apenas dois estágios. E mostrado que se pode eliminar o segundo estágio proposto por Martins-Filho e Yao, assim como, eliminar o segundo estagio proposto no primeiro artigo desta tese. Em ambos os casos, a estimação do mesmo modelo de fronteira de produção requer três estágios, sendo versões diferentes para o segundo estagio. As propriedades assintóticas do estimador proposto são analisadas, mostrando-se consistência e normalidade assintótica sob hipóteses razoáveis. No terceiro artigo, a proposta uma variação semi-paramétrica do modelo estudado no segundo artigo. Reescreve-se aquele modelo de modo que se possa estimar a fronteira de produção e a eficiência de unidades produtivas no contexto de múltiplos insumos, sem incorrer no curse of dimensionality. A abordagem adotada coloca o modelo na estrutura de modelos aditivos, a partir de hipóteses sobre como os insumos se combinam no processo produtivo. Em particular, considera-se aqui os casos de insumos aditivos e insumos multiplicativos, os quais são amplamente considerados em teoria econômica e aplicações. Estudos de Monte Carlo são apresentados em todos os artigos, afim de elucidar as propriedades dos estimadores propostos em amostras finitas. Além disso, estudos com dados reais são apresentados em todos os artigos, nos quais são estimador rankings de eficiência para uma amostra de departamentos policiais dos EUA, a partir de dados sobre criminalidade daquele país. / There exists a large and growing literature on the specification and estimation of production frontiers and therefore efficiency of production units. In this thesis we focus on deterministic production frontier models, which are based on the assumption that all observed data lie in the technological set. Among the existing statistical models and estimators for deterministic frontiers, a promising approach is that of Martins-Filho and Yao (2007). They propose an estimation procedure that consists of three stages. Their estimator is fairly easy to implement as it involves standard nonparametric procedures. In addition, it has a number of desirable characteristics vis-a-vis traditional deterministic frontier estimators as DEA and FDH. In this thesis we propose three papers that improve the model proposed in Martins-Filho and Yao (2007). In the first paper we improve their estimation procedure by adopting a variant of the local exponential smoothing proposed in Ziegelmann (2002). Our estimator is shown to be consistent and asymptotically normal. In addition, due to local exponential smoothing, potential negativity of conditional variance functions that may hinder the use of Martins-Filho and Yao's estimator is avoided. In the second paper we propose a novel method for estimating production frontiers in only two stages. (Continue). There we show that we can eliminate the second stage of Martins-Filho and Yao as well as of our first paper, where estimation of the same frontier model requires three stages under different versions for the second stage. We study asymptotic properties showing consistency andNirtnin, asymptotic normality of our proposed estimator under standard assumptions. In the third paper we propose a semiparametric variation of the frontier model studied in the second paper. We rewrite that model allowing for estimating the production frontier and efficiency of production units in a multiple input context without suffering the curse of dimensionality. Our approach places that model within the framework of additive models based on assumptions regarding the way inputs combine in production. In particular, we consider the cases of additive and multiplicative inputs, which are widely considered in economic theory and applications. Monte Carlo studies are performed in all papers to shed light on the finite sample properties of the proposed estimators. Furthermore a real data study is carried out in all papers, from which we rank efficiency within a sample of USA Law Enforcement agencies using USA crime data.
|
43 |
Inferência de redes gênicas por agrupamento, busca exaustiva e análise de predição intrinsecamente multivariada. / Gene networks inference by clustering, exhaustive search and intrinsically multivariate prediction analysis.Ricardo de Souza Jacomini 09 June 2017 (has links)
A inferência de redes gênicas (GN) a partir de dados de expressão gênica temporal é um problema crucial e desafiador em Biologia Sistêmica. Os conjuntos de dados de expressão geralmente consistem em dezenas de amostras temporais e as redes consistem em milhares de genes, tornando inúmeros métodos de inferência inviáveis na prática. Para melhorar a escalabilidade dos métodos de inferência de GNs, esta tese propõe um arcabouço chamado GeNICE, baseado no modelo de redes gênicas probabilísticas. A principal novidade é a introdução de um procedimento de agrupamento de genes, com perfis de expressão relacionados, para fornecer uma solução aproximada com complexidade computacional reduzida. Os agrupamentos definidos são usados para reduzir a dimensionalidade permitindo uma busca exaustiva mais eficiente pelos melhores subconjuntos de genes preditores para cada gene alvo de acordo com funções critério multivariadas. GeNICE reduz consideravelmente o espaço de busca porque os candidatos a preditores ficam restritos a um gene representante por agrupamento. No final, uma análise multivariada é realizada para cada subconjunto preditor definido, visando recuperar subconjuntos mínimos para simplificar a rede gênica inferida. Em experimentos com conjuntos de dados sintéticos, GeNICE obteve uma redução substancial de tempo quando comparado a uma solução anterior sem a etapa de agrupamento, preservando a precisão da predição de expressão gênica mesmo quando o número de agrupamentos é pequeno (cerca de cinquenta) e o número de genes é grande (ordem de milhares). Para um conjunto de dados reais de microarrays de Plasmodium falciparum, a precisão da predição alcançada pelo GeNICE foi de aproximadamente 97% em média. As redes inferidas para os genes alvos da glicólise e do apicoplasto refletem propriedades topológicas de redes complexas do tipo \"mundo pequeno\" e \"livre de escala\", para os quais grande parte das conexões são estabelecidas entre os genes de um mesmo módulo e algumas poucas conexões fazem o papel de estabelecer uma ponte entre os módulos (redes mundo pequeno), e o grau de distribuição das conexões entre os genes segue uma lei de potência, na qual a maioria dos genes têm poucas conexões e poucos genes (hubs) apresentam um elevado número de conexões (redes livres de escala), como esperado. / Gene network (GN) inference from temporal gene expression data is a crucial and challenging problem in Systems Biology. Expression datasets usually consist of dozens of temporal samples, while networks consist of thousands of genes, thus rendering many inference methods unfeasible in practice. To improve the scalability of GN inference methods, this work proposes a framework called GeNICE, based on Probabilistic Gene Networks; the main novelty is the introduction of a clustering procedure to group genes with related expression profiles, to provide an approximate solution with reduced computational complexity. The defined clusters were used to perform an exhaustive search to retrieve the best predictor gene subsets for each target gene, according to multivariate criterion functions. GeNICE greatly reduces the search space because predictor candidates are restricted to one representative gene per cluster. Finally, a multivariate analysis is performed for each defined predictor subset to retrieve minimal subsets and to simplify the network. In experiments with in silico generated datasets, GeNICE achieved substantial computational time reduction when compared to an existing solution without the clustering step, while preserving the gene expression prediction accuracy even when the number of clusters is small (about fifty) relative to the number of genes (order of thousands). For a Plasmodium falciparum microarray dataset, the prediction accuracy achieved by GeNICE was roughly 97% on average. The inferred networks for the apicoplast and glycolytic target genes reflects the topological properties of \"small-world\"and \"scale-free\"complex network models in which a large part of the connections is established between genes of the same functional module (smallworld networks) and the degree distribution of the connections between genes tends to form a power law, in which most genes present few connections and few genes (hubs) present a large number of connections (scale-free networks), as expected.
|
44 |
O teorema central do limite: um estudo ecológico do saber e do didáticoRodrigues, Chang Kuo 02 December 2009 (has links)
Made available in DSpace on 2016-04-27T16:59:00Z (GMT). No. of bitstreams: 1
Chang Kuo Rodrigues.pdf: 19165521 bytes, checksum: 423ed2c3982a3973f316dec156e2d596 (MD5)
Previous issue date: 2009-12-02 / This paper refers to the building of mathematical and/or statistical ideas and concepts
around Central Limit Theorem for Mathematics graduates.The investigation focuses
the importance of the theorem in Statistics Inference and its comprehension by the
professionals to be, who will act in Basic Education. Therefore, we chose to research
some books related to the teaching and learning process of the theorem and
emphasised its importance on the Mathematics teacher daily practice. The theoretical
approach is about Mathematics Teaching theories, particularly the Theory of Didactic
Transposition ( CHEVALLARD, 1985), with an echological approach under the
knowlwdge and teaching point of view ( ARTAUD, 1998). We chose methodological
procedures directed to the didactic design (ARTIGUE, 2009), with qualitative nature,
and whose assumptions are linked to Teaching Engineering (ARTIGUE, 1988). The
subjects of this investigation are the graduates who had some knowledge about
Basic Statistics and, from a previous analysis about the kind of knowledge they had
about the theme, we presented some activities in a problem-situation context
connected to the Mathematics teachers daily practice. The analysis of these results
allowed us to relate the existing problems between the subject and the students from
Basic Education, which involved statistics literacy. After these activities, there was a
dialogue, with discussions about the theme, allowing us to analyse how the ideas
and concepts around the Central Limit Theorem were built, being its comprehension
the main aim for the graduates. Besides that, we analysed some textbooks for higher
education, based on the Anthropological Theory of Didactic (CHEVALLARD, 1996,
1999), which also showed us the essential knowledge for the theorem to live ,
because the approach is under the knowledge and teaching echological point of
view. On the other hand, we detected what kind of limitations, or restrictions, exist in
the books analysed, interfering in the elaboration of the activities by the teacher.
Thus, our investigation reaffirms the importance of teaching and learning Statistics in
the various applications for the Mathematics teachers to be formation in a world
controlled by the technological advances, which interfere directly on the
understanding of the information we receive every moment / O presente trabalho refere-se à construção das ideias e dos conceitos matemáticos
e/ou estatísticos em torno do Teorema Central do Limite para os Licenciandos de
Matemática. O cerne da investigação limita-se à importância do teorema na
Inferência Estatística e à sua compreensão pelos futuros profissionais que atuarão
na Educação Básica. Nesse sentido, optamos por revisar algumas bibliografias que
têm relação com o processo de ensino e de aprendizagem do teorema e
enfatizamos sua importância na pratica do dia a dia do professor de Matemática. O
quadro teórico incide sobre as teorias da Didática da Matemática, particularmente, a
Teoria da Transposição Didática (CHEVALLARD, 1985), munido de uma abordagem
ecológica sob o ponto de vista do saber e do didático (ARTAUD, 1998). Optamos por
procedimentos metodológicos voltados para o design didático (ARTIGUE, 2009), de
cunho qualitativo e, cujos pressupostos estão aliados à Engenharia Didática
(ARTIGUE, 1988). Os sujeitos dessa investigação são os licenciandos que já
predispunham de conhecimentos sobre a Estatística Básica e, a partir de uma
análise prévia sobre que tipos de conhecimento eles já detinham sobre o tema,
apresentamos algumas atividades no contexto de uma situação-problema pertinente
ao cotidiano dos professores de Matemática. A análise desses resultados nos
propiciou interrelacionar as problemáticas existentes na disciplina de Matemática
com alunos da Educação Básica, envolvendo assim, a literacia estatística. Após a
realização dessas atividades, ocorreu também um diálogo, com discussões acerca
do tema, o que nos permitiu analisar como foram construídos as ideias e os
conceitos no entorno do Teorema Central do Limite, de modo que sua compreensão
fosse o principal alvo para os licenciandos. Além disso, analisamos alguns livrostexto
do ensino superior, à luz da Teoria Antropológica do Didático (CHEVALLARD,
1996, 1999), o que também nos indicou que saberes são indispensáveis de modo
que o teorema viva , já que a abordagem é sob o ponto de vista ecológico do saber
e do didático. Por outro lado, detectamos que tipos de limitações, ou restrições,
existem nas obras consultadas, interferindo assim, a elaboração das atividades por
parte do professor. Portanto, a nossa investigação reitera a importância do ensino e
da aprendizagem da Estatística nas diversas aplicações na formação dos futuros
professores de Matemática num mundo ditado pelos avanços tecnológicos, que
interferem diretamente na leitura de informações que recebemos a todo instante
|
45 |
Um modelo espaço-temporal bayesiano para medir a interação social na criminalidade : simulações e evidências na Região Metropolitana de São PauloGazzano, Marcelo January 2008 (has links)
Neste trabalho utilizamos um modelo espaço-temporal proposto em Rojas (2004) para medir a interação social da criminalidade na região metropolitana de São Paulo. Realizamos simulações de Monte Carlo para testar a capacidade de estimação do modelo em diferentes cenários. Observamos que a estimação melhora com o aumento de observações ao longo do tempo. Já os resultados empíricos indicam que a região metropolitana de São Paulo é um hot spot no estado, pois é encontrado um maior grau de interação social no índice de homicídio em relação aos índices de roubo e furto. / In this paper we employ a spatio-temporal model proposed in Rojas (2004) to evaluate the social interaction in crime in São Paulo metropolitan area. We carry out Monte Carlo simulations to test the model estimation capability in different scenarios. We notice that the estimation gets better as the number of observations in time raises. The results point out that São Paulo metropolitan area is a hot spot in the state since we found out a greater social interaction for the homicide index, compared to robbery and thievery.
|
46 |
Inferência no Ensino Médio : uma introdução aos testes de hipóteseConstantino Junior, Paulo Roberto January 2016 (has links)
Orientador: Prof. Dr. André Ricardo Oliveira da Fonseca / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Mestrado Profissional em Matemática em Rede Nacional, 2016. / No mundo contemporâneo é comum constantes pesquisas em diversos âmbitos,
tanto sociais, quanto econômicos, entre outros. Para tais pesquisas é fundamental
a coleta de dados, organizar os dados, como também construir tabelas e gráficos estatísticos,
entretanto é inadmissível não haver uma interpretação consistente sobre os
resultados. Desta forma, o objetivo deste trabalho é introduzir os alunos do Ensino
Médio, especificamente os do terceiro ano, na teoria da inferência estatística, por meio
de atividades experimentais, para que eles possam, num nível elementar, desenvolver
as primeiras compreensões a respeito dos meios de obtenção de uma amostra e das
conclusões possíveis sobre a respectiva população. Assim, estimulando os educandos
em buscar constantemente informações sobre pesquisas estatísticas, as quais estarão
presentes em vários momentos da sua vida em sociedade. / In the contemporary world it is common to come across frequent research from various
scopes, both social and economical amongst others. For such research, it is vital to
collect data, organize it as well as put together statistical charts and graphs. However
it is unacceptable that there is no consistent interpretation about the results. Therefore,
the objective of this work is to introduce High School students, more specifically
the seniors, to the theory of statistical inference, through experimental activities, so
that they can, at an elementary level, develop their primary understanding of both
the means to obtain a sample and the possible conclusions drawn about its respective
population. Thus, we expect to stimulate the students to constantly seek information
about statistical research, which will be present in many different moments in their
lives as part of society.
|
47 |
Estimação não-paramétrica e semi-paramétrica de fronteiras de produçãoTorrent, Hudson da Silva January 2010 (has links)
Existe uma grande e crescente literatura sobre especificação e estimação de fronteiras de produção e, portanto, de eficiência de unidades produtivas. Nesta tese, o foco esta sobre modelos de fronteiras determinísticas, os quais são baseados na hipótese de que os dados observados pertencem ao conjunto tecnológico. Dentre os modelos estatísticos e estimadores para fronteiras determinísticas existentes, uma abordagem promissora e a adotada por Martins-Filho e Yao (2007). Esses autores propõem um procedimento de estimação composto por três estágios. Esse estimador e de fácil implementação, visto que envolve procedimentos não-paramétricos bem conhecidos. Além disso, o estimador possui características desejáveis vis-à-vis estimadores para fronteiras determinísticas tradicionais como DEA e FDH. Nesta tese, três artigos, que melhoram o modelo proposto por Martins-Filho e Yao (2007), sao propostos. No primeiro artigo, o procedimento de estimação desses autores e melhorado a partir de uma variação do estimador exponencial local, proposto por Ziegelmann (2002). Demonstra-se que estimador proposto a consistente e assintoticamente normal. Além disso, devido ao estimador exponencial local, estimativas potencialmente negativas para a função de variância condicional, que poderiam prejudicar a aplicabilidade do estimador proposto por Martins-Filho e Yao, são evitadas. No segundo artigo, e proposto um método original para estimação de fronteiras de produção em apenas dois estágios. E mostrado que se pode eliminar o segundo estágio proposto por Martins-Filho e Yao, assim como, eliminar o segundo estagio proposto no primeiro artigo desta tese. Em ambos os casos, a estimação do mesmo modelo de fronteira de produção requer três estágios, sendo versões diferentes para o segundo estagio. As propriedades assintóticas do estimador proposto são analisadas, mostrando-se consistência e normalidade assintótica sob hipóteses razoáveis. No terceiro artigo, a proposta uma variação semi-paramétrica do modelo estudado no segundo artigo. Reescreve-se aquele modelo de modo que se possa estimar a fronteira de produção e a eficiência de unidades produtivas no contexto de múltiplos insumos, sem incorrer no curse of dimensionality. A abordagem adotada coloca o modelo na estrutura de modelos aditivos, a partir de hipóteses sobre como os insumos se combinam no processo produtivo. Em particular, considera-se aqui os casos de insumos aditivos e insumos multiplicativos, os quais são amplamente considerados em teoria econômica e aplicações. Estudos de Monte Carlo são apresentados em todos os artigos, afim de elucidar as propriedades dos estimadores propostos em amostras finitas. Além disso, estudos com dados reais são apresentados em todos os artigos, nos quais são estimador rankings de eficiência para uma amostra de departamentos policiais dos EUA, a partir de dados sobre criminalidade daquele país. / There exists a large and growing literature on the specification and estimation of production frontiers and therefore efficiency of production units. In this thesis we focus on deterministic production frontier models, which are based on the assumption that all observed data lie in the technological set. Among the existing statistical models and estimators for deterministic frontiers, a promising approach is that of Martins-Filho and Yao (2007). They propose an estimation procedure that consists of three stages. Their estimator is fairly easy to implement as it involves standard nonparametric procedures. In addition, it has a number of desirable characteristics vis-a-vis traditional deterministic frontier estimators as DEA and FDH. In this thesis we propose three papers that improve the model proposed in Martins-Filho and Yao (2007). In the first paper we improve their estimation procedure by adopting a variant of the local exponential smoothing proposed in Ziegelmann (2002). Our estimator is shown to be consistent and asymptotically normal. In addition, due to local exponential smoothing, potential negativity of conditional variance functions that may hinder the use of Martins-Filho and Yao's estimator is avoided. In the second paper we propose a novel method for estimating production frontiers in only two stages. (Continue). There we show that we can eliminate the second stage of Martins-Filho and Yao as well as of our first paper, where estimation of the same frontier model requires three stages under different versions for the second stage. We study asymptotic properties showing consistency andNirtnin, asymptotic normality of our proposed estimator under standard assumptions. In the third paper we propose a semiparametric variation of the frontier model studied in the second paper. We rewrite that model allowing for estimating the production frontier and efficiency of production units in a multiple input context without suffering the curse of dimensionality. Our approach places that model within the framework of additive models based on assumptions regarding the way inputs combine in production. In particular, we consider the cases of additive and multiplicative inputs, which are widely considered in economic theory and applications. Monte Carlo studies are performed in all papers to shed light on the finite sample properties of the proposed estimators. Furthermore a real data study is carried out in all papers, from which we rank efficiency within a sample of USA Law Enforcement agencies using USA crime data.
|
48 |
Um modelo espaço-temporal bayesiano para medir a interação social na criminalidade : simulações e evidências na Região Metropolitana de São PauloGazzano, Marcelo January 2008 (has links)
Neste trabalho utilizamos um modelo espaço-temporal proposto em Rojas (2004) para medir a interação social da criminalidade na região metropolitana de São Paulo. Realizamos simulações de Monte Carlo para testar a capacidade de estimação do modelo em diferentes cenários. Observamos que a estimação melhora com o aumento de observações ao longo do tempo. Já os resultados empíricos indicam que a região metropolitana de São Paulo é um hot spot no estado, pois é encontrado um maior grau de interação social no índice de homicídio em relação aos índices de roubo e furto. / In this paper we employ a spatio-temporal model proposed in Rojas (2004) to evaluate the social interaction in crime in São Paulo metropolitan area. We carry out Monte Carlo simulations to test the model estimation capability in different scenarios. We notice that the estimation gets better as the number of observations in time raises. The results point out that São Paulo metropolitan area is a hot spot in the state since we found out a greater social interaction for the homicide index, compared to robbery and thievery.
|
49 |
Estimação não-paramétrica e semi-paramétrica de fronteiras de produçãoTorrent, Hudson da Silva January 2010 (has links)
Existe uma grande e crescente literatura sobre especificação e estimação de fronteiras de produção e, portanto, de eficiência de unidades produtivas. Nesta tese, o foco esta sobre modelos de fronteiras determinísticas, os quais são baseados na hipótese de que os dados observados pertencem ao conjunto tecnológico. Dentre os modelos estatísticos e estimadores para fronteiras determinísticas existentes, uma abordagem promissora e a adotada por Martins-Filho e Yao (2007). Esses autores propõem um procedimento de estimação composto por três estágios. Esse estimador e de fácil implementação, visto que envolve procedimentos não-paramétricos bem conhecidos. Além disso, o estimador possui características desejáveis vis-à-vis estimadores para fronteiras determinísticas tradicionais como DEA e FDH. Nesta tese, três artigos, que melhoram o modelo proposto por Martins-Filho e Yao (2007), sao propostos. No primeiro artigo, o procedimento de estimação desses autores e melhorado a partir de uma variação do estimador exponencial local, proposto por Ziegelmann (2002). Demonstra-se que estimador proposto a consistente e assintoticamente normal. Além disso, devido ao estimador exponencial local, estimativas potencialmente negativas para a função de variância condicional, que poderiam prejudicar a aplicabilidade do estimador proposto por Martins-Filho e Yao, são evitadas. No segundo artigo, e proposto um método original para estimação de fronteiras de produção em apenas dois estágios. E mostrado que se pode eliminar o segundo estágio proposto por Martins-Filho e Yao, assim como, eliminar o segundo estagio proposto no primeiro artigo desta tese. Em ambos os casos, a estimação do mesmo modelo de fronteira de produção requer três estágios, sendo versões diferentes para o segundo estagio. As propriedades assintóticas do estimador proposto são analisadas, mostrando-se consistência e normalidade assintótica sob hipóteses razoáveis. No terceiro artigo, a proposta uma variação semi-paramétrica do modelo estudado no segundo artigo. Reescreve-se aquele modelo de modo que se possa estimar a fronteira de produção e a eficiência de unidades produtivas no contexto de múltiplos insumos, sem incorrer no curse of dimensionality. A abordagem adotada coloca o modelo na estrutura de modelos aditivos, a partir de hipóteses sobre como os insumos se combinam no processo produtivo. Em particular, considera-se aqui os casos de insumos aditivos e insumos multiplicativos, os quais são amplamente considerados em teoria econômica e aplicações. Estudos de Monte Carlo são apresentados em todos os artigos, afim de elucidar as propriedades dos estimadores propostos em amostras finitas. Além disso, estudos com dados reais são apresentados em todos os artigos, nos quais são estimador rankings de eficiência para uma amostra de departamentos policiais dos EUA, a partir de dados sobre criminalidade daquele país. / There exists a large and growing literature on the specification and estimation of production frontiers and therefore efficiency of production units. In this thesis we focus on deterministic production frontier models, which are based on the assumption that all observed data lie in the technological set. Among the existing statistical models and estimators for deterministic frontiers, a promising approach is that of Martins-Filho and Yao (2007). They propose an estimation procedure that consists of three stages. Their estimator is fairly easy to implement as it involves standard nonparametric procedures. In addition, it has a number of desirable characteristics vis-a-vis traditional deterministic frontier estimators as DEA and FDH. In this thesis we propose three papers that improve the model proposed in Martins-Filho and Yao (2007). In the first paper we improve their estimation procedure by adopting a variant of the local exponential smoothing proposed in Ziegelmann (2002). Our estimator is shown to be consistent and asymptotically normal. In addition, due to local exponential smoothing, potential negativity of conditional variance functions that may hinder the use of Martins-Filho and Yao's estimator is avoided. In the second paper we propose a novel method for estimating production frontiers in only two stages. (Continue). There we show that we can eliminate the second stage of Martins-Filho and Yao as well as of our first paper, where estimation of the same frontier model requires three stages under different versions for the second stage. We study asymptotic properties showing consistency andNirtnin, asymptotic normality of our proposed estimator under standard assumptions. In the third paper we propose a semiparametric variation of the frontier model studied in the second paper. We rewrite that model allowing for estimating the production frontier and efficiency of production units in a multiple input context without suffering the curse of dimensionality. Our approach places that model within the framework of additive models based on assumptions regarding the way inputs combine in production. In particular, we consider the cases of additive and multiplicative inputs, which are widely considered in economic theory and applications. Monte Carlo studies are performed in all papers to shed light on the finite sample properties of the proposed estimators. Furthermore a real data study is carried out in all papers, from which we rank efficiency within a sample of USA Law Enforcement agencies using USA crime data.
|
50 |
Meta-análise de parâmetros genéticos de características de crescimento em bovinos de corte sob enfoques clássico e Bayesiano. / Meta-analysis of genetic parameters of growth traits on beef cattle under classic and bayesian approach.Juliana Di Giorgio Giannotti 03 September 2004 (has links)
O crescente volume de publicações científicas gerado pelo desenvolvimento das pesquisas e as conclusões, algumas vezes destoantes, obtidas em diferentes trabalhos versando sobre um mesmo tema, são as duas principais motivações de pesquisadores em compilar informações publicadas. Em vista disso, procedimentos estatísticos, dentre os quais destaca-se a meta-análise, vêm sendo desenvolvidos para obtenção de uma resposta única e confiável para um conjunto de resultados publicados.No melhoramento genético animal há um grande número de trabalhos contendo estimativas de herdabilidade de características de crescimento em bovinos de corte. Através de pesquisa bibliográfica foram encontrados, em 186 artigos publicados, 869 estimativas de herdabilidade de efeito direto, 186 estimativas de herdabilidade de efeito materno e 123 estimativas do coeficiente de correlação genética entre os efeitos direto e materno, das características de crescimento peso ao nascimento, peso a desmama, peso aos 365 dias e peso aos 550 dias em bovinos de corte de origem indiana. De posse deste conjunto de dados, foram realizadas meta-análises, dentro de cada uma das quatro características de crescimento, cujo objetivo principal foi obter uma resposta combinada, para estes parâmetros genéticos, sob enfoques clássico e bayesiano. No enfoque clássico conduziram-se as meta-análises utilizando modelos fixo e aleatório, em que dois estimadores, o de máxima verossimilhança restrita e o proposto por DerSimonian & Laird, foram empregados para estimar a variância entre os estudos. Também foi realizada meta-análise de acordo com a técnica de agrupamento de Ward. Sob o enfoque bayesiano, as meta-análises foram conduzidas utilizando-se um modelo hierárquico e, a variância entre os estudos, foi obtida via simulação através do modelo proposto. As estimativas combinadas de herdabilidade de efeito direto variaram de 0,18 a 0,33, nos diferentes grupos formados a partir da análise de agrupamento, sendo sempre menores àquelas obtidas para peso à desmama e sempre maiores àquelas obtidas para peso aos 550 dias. As estimativas combinadas de herdabilidade de efeito materno foram 0,09 para peso ao nascimento, 0,13 para peso à desmama, 0,12 para peso aos 365 dias e 0,05 para peso aos 550 dias. As estimativas combinadas para correlação entre os efeitos diretos e maternos foram de 0,16 para peso ao nascimento, à desmama e aos 550 dias e -0,20 para peso aos 365 dias. Os três métodos utilizados para estimar a variância entre os estudos, o da máxima verossimilhança restrita, o proposto por DerSimonian & Laird e o Bayesiano, conduziram a valores distintos para esta variância, sendo sempre maiores os valores obtidos através do método Bayesiano e sempre menores os obtidos por DerSimonian & Laird. Porém, os valores das estimativas combinadas para herdabilidades de efeito direto, obtidas através destes três estimadores, muito próximos, para as quatro características. Devido ao fato de comparar e combinar resultados de estudos distintos, permitindo inferir sobre um conjunto de resultados publicados, recomenda-se a meta-análise, como procedimento estatístico, para obtenção de valores combinados das estimativas de herdabilidade de efeito direto, materno e suas correlações, nas características de crescimento em bovinos de corte. / The increasing volume of research publications as a consequence of scientific development and eventually with divergent conclusions obtained in different studies about the same subject are the two main motivations for compiling the information of these works. Statistical procedures, particularly the meta-analysis, were developed in order to obtain a unique and realistic answer from a set of published results. In the field of animal breeding there is a large amount of research work on heritability estimates for growth traits in beef cattle. A total of 186 articles was found in literature, reporting 869 direct heritability estimates, 186 maternal heritability estimates and 123 direct-maternal genetic correlation for birth weight, weaning weight, weight at 365 and at 550 days of age in zebu beef cattle. Based on this data set, meta-analysis, under Classic and Bayesian approaches, were performed in order to obtain a pooled estimate of those genetic parameters for each trait. Regarding the Classic approach, the meta-analysis were performed using a random effect model, where two estimators, the Restricted Maximum Likelihood and the one proposed by DerSimonian & Laird were used to evaluate the variance between studies. Also, it was performed a meta-analysis using the method of cluster analysis of Ward to group the estimates. Under the Bayesian approach, the meta-analysis was performed using a hierarchical model and the variances between the studies, were obtained by simulation using the proposed model. The pooled estimates for direct heritabilities ranged from 0.18 to 0.33 for the different groups composed by the cluster analysis. The lower values were obtained for weaning weight and higher values were obtained for weight at 550 days of age. The pooled estimates for maternal heritabilities were 0.09 for birth weight, 0.13 for weaning weight, 0.12 for weight at 365 days of age and 0.05 for weight at 550 days of age. The pooled estimates for direct-maternal genetic correlations were -0.16 for birth weight, weaning weight and weight at 550 days of age and -0.20 for weight at 365 days of age. The three methods, Restricted Maximum likelihood, the estimator proposed by DerSimonian & Laird and the Bayesian, used to estimate the variance between studies lead to different values, the greater ones obtained by Bayesian method and the lower by DerSimonian & Laird. In general, pooled estimates values for direct heritabilities, obtained by those three estimators, were very close. Meta-analysis is recommended as a statistical procedure to compare and combine results from different studies in order to obtain pooled values of direct and maternal heritabilities and direct-maternal genetic correlations of growth traits of beef cattle.
|
Page generated in 0.1026 seconds