• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 6
  • Tagged with
  • 7
  • 7
  • 7
  • 6
  • 6
  • 6
  • 6
  • 6
  • 5
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Record Linkage

Larsen, Stasha Ann Bown 11 December 2013 (has links) (PDF)
This document explains the use of different metrics involved with record linkage. There are two forms of record linkage: deterministic and probabilistic. We will focus on probabilistic record linkage used in merging and updating two databases. Record pairs will be compared using character-based and phonetic-based similarity metrics to determine at what level they match. Performance measures are then calculated and Receiver Operating Characteristic (ROC) curves are formed. Finally, an economic model is applied that returns the optimal tolerance level two databases should use to determine a record pair match in order to maximize profit.
2

O uso de método de relacionamento de dados (record linkage) para integração de informação em sistemas heterogêneos de saúde: estudo de aplicabilidade entre níveis primário e terciário / The use of record linkage method for integration heterogeneous information systems in health: a study of applicability between primary and tertiary

Suzuki, Katia Mitiko Firmino 21 September 2012 (has links)
O relacionamento de dados record linkage, originou-se na área da saúde pública e atualmente é aplicado em várias outras áreas como: epidemiologia, pesquisa médica, criação de ensaios clínicos, na área de marketing, gestão de relacionamento com o cliente, detecção de fraude, aplicação da lei e na administração do governo. A técnica consiste no processo de comparação entre dois ou mais registros em diferentes bases de dados e as principais estratégias de record linkage são: manual, deterministic record linkage (DRL) e probabilistic record linkage (PRL). Este estudoteve como objetivo aplicar o record linkage em bases de dados heterogêneas, utilizadas pela rede de atenção à saúde do município de Ribeirão Preto e identificar entre elas a melhor estratégia a ser adotada para a integração de bases de dados na área da saúde. As bases de dados da secretaria Municipal de Saúde de Ribeirão Preto (SMS-RP) e do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP/USP) foram objeto deste estudo, tendo como critério de inclusão apenas os registros de pacientes em que o município de residência informado correspondia ao município de Ribeirão Preto e o atendimento tivesse ocorrido na Unidade Básica Distrital e de Saúde (UDBS) - Centro Saúde Escola Joel Domingos Machado\" (CSE-Sumarezinho) nos anos de janeiro de 2006 a agosto de 2008 e no HCFMRP/USP. Foi selecionada uma amostra aleatória simples resultando em um conjunto de 1.100 registros de pacientes na base de dados do CSE-Sumarezinho e de 370.375 registros na base de dados do HCFMRP/USP. Foram, então, selecionadas quatro variáveis de relacionamento (nome, nome da mãe, sexo e data de nascimento). As estratégias adotadas foram: DRL exato, DRL com discordância em uma variável de relacionamento, e baseada em funções de similaridades (Dice, Levenshtein, Jaro e Jaro-Winkler) e, por fim, PRL. A estratégia DRL exato resultou em 334 registros pareados e na abordagem com discordância de uma variável foram 335, 343, 383 e 495, sendo as variáveis discordantes sexo, data de nascimento, nome e nome da mãe respectivamente. Quanto ao uso das funções de similaridades, as que mais se destacaram foram Jaro-Winkler e Jaro. Quanto à acurácia dos métodos aplicados, o PRL (sensibilidade = 97,75% (CI 95% 96,298,8) e especificidade = 98,55% (CI 95% 97,0-99,4)) obteve melhor sensibilidade e especificidade, seguido do DRL com as funções de similaridade Jaro-Winkler sensibilidade = 91,3% (CI 95% 88,793,4) e especificidade = 99% (CI 95% 97,6-99,7)) e Jaro (sensibilidade = 73,1% (CI 95% 69,476,6) e especificidade = 99,6% (CI 95% 98,5-99,9)). Quanto à avaliação da área sob a curva ROC do PRL, observou-se que há diferença estatisticamente significativa (p = 0,0001) quando comparada com os métodos DRL com discordância da variável nome da mãe, Jaro-Winkler e Jaro. Os resultados obtidos permitem concluir que o método PRL é mais preciso dentre as técnicas avaliadas. Mas as técnicas com a função de similaridade de Jaro-Winkler e Jaro também são alternativas viáveis interessantes devido à facilidade de utilização apesar de apresentarem o valor de sensibilidade ligeiramente menor que o PRL. / The record linkage originated in the area of public health and is currently applied in several other areas such as epidemiology, medical research, establishment of clinical trials, in the area of marketing, manager customer relationships, fraud detection, law enforcement and government administration. The technique consists on the comparison between two or more records in different databases and their key strategies are: manual comparison, Deterministic Record Linkage (DRL), and Probabilistic Record Linkage (PRL).This study aimed to apply the record linkage in heterogeneous databases, used by the network of health care in Ribeirão Preto and identify the best strategy to be adopted for the integration of databases in health care. The databases that were evaluated in this study were of the Municipal Health Department of Ribeirão Preto (SMS-RP) and of the Clinical Hospital of the School of Medicine of Ribeirao Preto (HCFMRP/USP) having as inclusion criterion only the records of patients in the county of residence reported corresponded to the city of Ribeirão Preto and care had taken place in the Basic District Health Unit (UDBS) - School Health Center \"Joel Domingos Machado\" (CSE-Sumarezinho) included in the years from January 2006 to August 2008 and in the HCFMRP/USP. Held to select a simple random sample resulted in a set of 1,100 patient records in the database of the CSE-Sumarezinho and 370,375 records in the database of HCFMRP/USP. Then there was the selection of four linking variables (name, mother\'s name, gender and birth date). The strategies adopted were: the exact DRL, DRL with one variable where the linking is disagreement, applied with similarity functions (Dice, Levenshtein, Jaro, and Jaro-Winkler), and, finally, PRL. The strategy of the exact DRL resulted in 334 matched records and strategy in dealing with disagreement of one variable were 335, 343, 383 and 495, to the following variables discordant gender, birth date, name and mother\'s name, respectively. Regarding the use of similarity functions which most stood out were Jaro and Jaro-Winkler. Regarding the accuracy of the methods applied, the PRL obtained better sensitivity and specificity (sensitivity = 97,75% (CI 95% 96,298,8) and specificity = 98.55% (95% CI 97.0 to 99.4)), followed by the DRL with the similarity functions Jaro-Winkler (sensitivity = 91.3% (95% CI 88.7 to 93.4) and specificity = 99% (95% CI 97.6 to 99, 7)) and then by Jaro (sensitivity = 73.1% (95% CI 69.4 to 76.6) = 99.6% and specificity (95% CI 98.5 to 99.9)). The evaluation of the area under the ROC curve in the PRL, was observed that there is statistically significant difference (p = 0.0001) if it is compared with the DRL methods when there is disagreement in the variable mother\'s name, as well as for Jaro and for Jaro-Winkler. The results indicate that the PRL method is most accurate among the techniques evaluated. Although the techniques with the similarity function of Jaro-Winkler and Jaro were also interesting viable options due to the ease of use, although having the sensitivity value slightly smaller than the PRL.
3

O uso de método de relacionamento de dados (record linkage) para integração de informação em sistemas heterogêneos de saúde: estudo de aplicabilidade entre níveis primário e terciário / The use of record linkage method for integration heterogeneous information systems in health: a study of applicability between primary and tertiary

Katia Mitiko Firmino Suzuki 21 September 2012 (has links)
O relacionamento de dados record linkage, originou-se na área da saúde pública e atualmente é aplicado em várias outras áreas como: epidemiologia, pesquisa médica, criação de ensaios clínicos, na área de marketing, gestão de relacionamento com o cliente, detecção de fraude, aplicação da lei e na administração do governo. A técnica consiste no processo de comparação entre dois ou mais registros em diferentes bases de dados e as principais estratégias de record linkage são: manual, deterministic record linkage (DRL) e probabilistic record linkage (PRL). Este estudoteve como objetivo aplicar o record linkage em bases de dados heterogêneas, utilizadas pela rede de atenção à saúde do município de Ribeirão Preto e identificar entre elas a melhor estratégia a ser adotada para a integração de bases de dados na área da saúde. As bases de dados da secretaria Municipal de Saúde de Ribeirão Preto (SMS-RP) e do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP/USP) foram objeto deste estudo, tendo como critério de inclusão apenas os registros de pacientes em que o município de residência informado correspondia ao município de Ribeirão Preto e o atendimento tivesse ocorrido na Unidade Básica Distrital e de Saúde (UDBS) - Centro Saúde Escola Joel Domingos Machado\" (CSE-Sumarezinho) nos anos de janeiro de 2006 a agosto de 2008 e no HCFMRP/USP. Foi selecionada uma amostra aleatória simples resultando em um conjunto de 1.100 registros de pacientes na base de dados do CSE-Sumarezinho e de 370.375 registros na base de dados do HCFMRP/USP. Foram, então, selecionadas quatro variáveis de relacionamento (nome, nome da mãe, sexo e data de nascimento). As estratégias adotadas foram: DRL exato, DRL com discordância em uma variável de relacionamento, e baseada em funções de similaridades (Dice, Levenshtein, Jaro e Jaro-Winkler) e, por fim, PRL. A estratégia DRL exato resultou em 334 registros pareados e na abordagem com discordância de uma variável foram 335, 343, 383 e 495, sendo as variáveis discordantes sexo, data de nascimento, nome e nome da mãe respectivamente. Quanto ao uso das funções de similaridades, as que mais se destacaram foram Jaro-Winkler e Jaro. Quanto à acurácia dos métodos aplicados, o PRL (sensibilidade = 97,75% (CI 95% 96,298,8) e especificidade = 98,55% (CI 95% 97,0-99,4)) obteve melhor sensibilidade e especificidade, seguido do DRL com as funções de similaridade Jaro-Winkler sensibilidade = 91,3% (CI 95% 88,793,4) e especificidade = 99% (CI 95% 97,6-99,7)) e Jaro (sensibilidade = 73,1% (CI 95% 69,476,6) e especificidade = 99,6% (CI 95% 98,5-99,9)). Quanto à avaliação da área sob a curva ROC do PRL, observou-se que há diferença estatisticamente significativa (p = 0,0001) quando comparada com os métodos DRL com discordância da variável nome da mãe, Jaro-Winkler e Jaro. Os resultados obtidos permitem concluir que o método PRL é mais preciso dentre as técnicas avaliadas. Mas as técnicas com a função de similaridade de Jaro-Winkler e Jaro também são alternativas viáveis interessantes devido à facilidade de utilização apesar de apresentarem o valor de sensibilidade ligeiramente menor que o PRL. / The record linkage originated in the area of public health and is currently applied in several other areas such as epidemiology, medical research, establishment of clinical trials, in the area of marketing, manager customer relationships, fraud detection, law enforcement and government administration. The technique consists on the comparison between two or more records in different databases and their key strategies are: manual comparison, Deterministic Record Linkage (DRL), and Probabilistic Record Linkage (PRL).This study aimed to apply the record linkage in heterogeneous databases, used by the network of health care in Ribeirão Preto and identify the best strategy to be adopted for the integration of databases in health care. The databases that were evaluated in this study were of the Municipal Health Department of Ribeirão Preto (SMS-RP) and of the Clinical Hospital of the School of Medicine of Ribeirao Preto (HCFMRP/USP) having as inclusion criterion only the records of patients in the county of residence reported corresponded to the city of Ribeirão Preto and care had taken place in the Basic District Health Unit (UDBS) - School Health Center \"Joel Domingos Machado\" (CSE-Sumarezinho) included in the years from January 2006 to August 2008 and in the HCFMRP/USP. Held to select a simple random sample resulted in a set of 1,100 patient records in the database of the CSE-Sumarezinho and 370,375 records in the database of HCFMRP/USP. Then there was the selection of four linking variables (name, mother\'s name, gender and birth date). The strategies adopted were: the exact DRL, DRL with one variable where the linking is disagreement, applied with similarity functions (Dice, Levenshtein, Jaro, and Jaro-Winkler), and, finally, PRL. The strategy of the exact DRL resulted in 334 matched records and strategy in dealing with disagreement of one variable were 335, 343, 383 and 495, to the following variables discordant gender, birth date, name and mother\'s name, respectively. Regarding the use of similarity functions which most stood out were Jaro and Jaro-Winkler. Regarding the accuracy of the methods applied, the PRL obtained better sensitivity and specificity (sensitivity = 97,75% (CI 95% 96,298,8) and specificity = 98.55% (95% CI 97.0 to 99.4)), followed by the DRL with the similarity functions Jaro-Winkler (sensitivity = 91.3% (95% CI 88.7 to 93.4) and specificity = 99% (95% CI 97.6 to 99, 7)) and then by Jaro (sensitivity = 73.1% (95% CI 69.4 to 76.6) = 99.6% and specificity (95% CI 98.5 to 99.9)). The evaluation of the area under the ROC curve in the PRL, was observed that there is statistically significant difference (p = 0.0001) if it is compared with the DRL methods when there is disagreement in the variable mother\'s name, as well as for Jaro and for Jaro-Winkler. The results indicate that the PRL method is most accurate among the techniques evaluated. Although the techniques with the similarity function of Jaro-Winkler and Jaro were also interesting viable options due to the ease of use, although having the sensitivity value slightly smaller than the PRL.
4

Uso da técnica de linkage nos sistemas de informação em saúde: aplicação na base de dados do Registro de Câncer de base populacional do município de São Paulo / The use of the linkage technique in health information systems: application in the database of the São Paulo Population-based Cancer Registry

Peres, Stela Verzinhasse 07 December 2011 (has links)
A disponibilidade de grandes bases de dados informatizadas em saúde tornou a técnica de relacionamento de fontes de dados, também conhecida como linkage, uma alternativa para diferentes tipos de estudos. Esta técnica proporciona a geração de uma base de dados mais completa e de baixo custo operacional. Objetivo- Investigar a possibilidade de completar/aperfeiçoar as informações da base de dados do RCBP-SP, no período de 1997 a 2005, utilizando o processo de linkage com três outras bases, a saber: Programa de Aprimoramento de Mortalidade (PRO-AIM), Autorização e Procedimentos de Alta Complexidade (APAC-SIA/SUS) e Fundação Sistema Estadual de Análise de Dados (FSeade). Métodos- Neste estudo foi utilizada a base de dados do RCBP-SP, composta por 343.306 com casos incidentes de câncer do município de São Paulo, registrados no período de 1997 a 2005, com idades que variaram de menos de um a 106 anos, de ambos os sexos. Para a completitude das informações do RCBP-SP foram utilizadas as bases de dados, a saber: PRO-AIM, APAC-SIA/SUS e FSeade. Foram utilizadas as técnicas de linkage probabilística e determinística. O linkage probabilístico foi realizado pelo programa Reclink III versão 3.1.6. Quanto ao linkage determinístico as rotinas foram realizadas em Visual Basic, com as bases hospedadas em SQL Server. Foram calculados os coeficientes brutos de incidência (CBI) e mortalidade (CBM) antes e após o linkage. A análise de sobrevida global foi realizada pela técnica de Kaplan-Meier e para na comparação entre as curvas, utilizou-se o teste de log rank. Foram calculados os valores da área sob a curva, sensibilidade e especificidade para determinar o ponto de corte do escore de maior precisão na identificação dos pares verdadeiros. Resultados- Após o linkage, verificou-se um ganho de 101,5 por cento para a variável endereço e 31,5 por cento para a data do óbito e 80,0 por cento para a data da última informação. Quanto à variável nome da mãe, na base de dados do RCBP-SP antes do linkage esta informação representava somente 0,5 por cento , tendo sido complementada, no geral, em 76.332 registros. A análise de sobrevida global mostrou que antes do processo de linkage havia uma subestimação na probabilidade de estar vivo em todos os períodos analisados. No geral, para a análise de sobrevida truncada em sete anos, a probabilidade de estar vivo no primeiro ano de seguimento antes do linkage foi menor quando comparada a probabilidade de estar vivo ao primeiro ano de seguimento após o linkage (48,8 por cento x 61,1 por cento ; p< 0,001). Conclusão- A técnica de linkage tanto probabilística quanto determinística foi efetiva para completar/aperfeiçoar as informações da base de dados do RCBP-SP. Além do mais, o CBI apresentou um ganho de 3,4 por cento . Quanto ao CBM houve um ganho de 25,8 por cento . Após o uso da técnica de linkage, foi verificado que os valores para a sobrevida global estavam subestimados para ambos os sexos, faixas etárias e para as topografias de câncer / The availability of large computerized databases on health has enabled the record linkage technique, an alternative for different study designs. This technique provides the generation of a more complete database, at low operational cost. Objective to investigate the possibility of completing/improving information from the database of the RCBP-SP, in the period between 1997 and 2005, using the record linkage technique with other three databases, namely: Mortality Improvement Program (PRO-AIM), Authorization of Highly Complex Procedures (APAC-SIA/SUS) and State System of Data Analysis (FSeade), comparing different strategies. Methods In this study we used the database of the RCBP-SP composed of 343,306 incident cancer cases in the Municipality of São Paulo registered in the period between 1997 and 2005 with ages raging from under one to 106 years, from both sexes. To complete the database of the RCBP-SP three databases were used, namely: PRO-AIM, APAC-SIA/SUS and FSeade. Both probabilistic and deterministic record linkage were used. Probabilistic linkage was performed using the Reclink III software, version 3.1.6. As for the the deterministic record linkage, the routines were run in the Visual Basic and databases hosted on a SQL Server. Before and after record linkage, crude incidence (CIR) and mortality rates (CMR) were calculated. The overall survival analysis was performed using the Kaplan-Meier technique and for the comparison between curves, the log rank test was employed. In order to determine the most precise cut-off scores in identifying true matches, we calculated the area under the curve, as well as, sensitivity and specificity. Results After record linkage, it was verified a gain of 101.5 per cent for the variable address, 31.5 per cent for death date and 80,0 per cent for the date of latest information. As for the variable mother´s name, in the database of the RCBP-SP before record linkage, this information represented only 0.5 per cent , having been completed, in general, in 76,332 registries. The overall survival analysis showed that before the record linkage there was an underestimation of the probability of being alive for all periods assessed. In general, for the truncated survival at seven years, the probability of being alive at the first year of follow up before record linkage was lower when compared to the probability of being alive at the first year of follow up after record linkage (48.8 per cent x 61.1 per cent ; p< 0.001). Conclusion Both the probabilistic and deterministic record linkage were effective to complete/improve information from the database of the RCBP-SP. Moreover, the CIR had a gain of de 3.4 per cent . As for the CMR, there was a gain of 25.8 per cent . After using the record linkage technique, it was verified that values for overall survival were underestimated for both sexes, all age groups, and cancer sites
5

A epidemiologia do câncer em crianças e adolescentes com Aids no Município de São Paulo: um estudo de base populacional / The cancer epidemiology in children and adolescents with AIDS in the Municipality of São Paulo: a population-based study

Tanaka, Luana Fiengo 21 March 2017 (has links)
Introdução: A associação entre a infecção pelo vírus da imunodeficiência humana (HIV) e o câncer tem sido documentada desde os primórdios da epidemia da síndrome da imunodeficiência adquirida (Aids). A introdução da highly active antirretroviral therapy (HAART) alterou, profundamente, o curso da epidemia da Aids, reduzindo, drasticamente, a incidência de manifestações definidoras da síndrome, incluindo cânceres. No entanto, existem informações limitadas sobre a incidência de câncer em crianças e adolescentes com Aids vivendo em países em desenvolvimento. Objetivo: Descrever a epidemiologia do câncer em crianças e adolescentes com Aids no Município de São Paulo, no período de 1997 a 2012. Métodos: Trata-se de um estudo de base populacional, utilizando as bases de dados do Registro de Câncer de Base Populacional do Município de São Paulo e do Sistema de Informações de Agravos de Notificação (SINAN). As crianças e adolescentes (< 20 anos) com Aids e câncer foram identificadas por meio de um processo de linkage probabilístico entre as bases de dados supracitadas. Foram calculadas as taxas de incidência brutas e ajustadas por milhão de habitantes. Para comparar a incidência de câncer na população com Aids e a população geral foi calculada a razão de incidência padronizada (RIP) e respectivos intervalos de confiança de 95 por cento (IC 95 por cento ). A análise de tendência foi feita por meio do cálculo do annual percent change (APC) e IC 95 por cento correspondentes. A análise da sobrevida global de cinco anos após o câncer entre pacientes com Aids e na população geral foi calculada por meio do estimador produto limite de Kaplan-Meier e modelos univariados de riscos proporcionais de Cox. Mapas coropléticos em escalas monocromáticas foram gerados para descrever a distribuição de casos no Município. Resultados: Foram identificados 24 casos de câncer em pacientes com Aids menores de 20 anos, sendo 62,5 por cento cânceres definidores de Aids. Os cânceres mais incidentes foram o linfoma não Hodgkin, incluindo o linfoma de Burkitt (12; 50,0 por cento ), o linfoma de Hodgkin (6; 25,0 por cento ) e o sarcoma de Kaposi (3; 12,5 por cento ). A taxa bruta de incidência foi de 1.461,3 casos/milhão. A análise de tendência revelou redução significativa da incidência para todos os cânceres (APC= -14,5), influenciada pela queda nos cânceres definidores de Aids (APC= -17,0). O risco para câncer se mostrou aumentado (RIP= 3,9), sobretudo para o linfoma não Hodgkin, excluindo linfoma de Burkitt (RIP= 22,5), linfoma de Burkitt (RIP= 29,7) e linfoma de Hodgkin (RIP= 18,7). A probabilidade acumulada de sobrevida aos cinco anos foi de 56,3 por cento em crianças e adolescentes com Aids versus 87,5 por cento na população geral. A hazard ratio para óbito foi 5,2 (IC 95 por cento = 2,0; 13,6). O mapa da distribuição geográfica mostrou concentração dos casos nas áreas de classes sociais mais baixas do Município. Conclusão: Houve redução acentuada da incidência de cânceres definidores de Aids, como provável resultado da introdução da HAART. No entanto, crianças e adolescentes com Aids permanecem sob risco aumentado para o desenvolvimento de câncer quando comparadas à população geral. Para aquelas que desenvolveram câncer, o risco para óbito também se mostrou substancialmente elevado / Introduction: The association between human immunodeficiency virus (HIV) infection and cancer has been documented since the beginning of the epidemic of the acquired immunodeficiency syndrome (AIDS). The introduction of the highly active antiretroviral therapy (HAART) has profoundly altered the course of the AIDS epidemic, drastically reducing the incidence of AIDS-defining manifestations, including cancers. Nevertheless, there is limited information on the incidence of cancer in children and adolescents with AIDS living in developing countries. Objective: To describe the cancer epidemiology in children and adolescents with AIDS in the Municipality of São Paulo from 1997 to 2012. Methods: It is a population-based study, using the databases of the Population-based Cancer Registry of São Paulo and the Notifiable Diseases Information System (SINAN). Children and adolescents (< 20 years) with AIDS and cancer have been identified by means of a probabilistic record linkage process between the aforementioned databases. Crude and age-standardized incidence rates per million inhabitants were calculated. To compare the incidence of cancer in people with AIDS and that of the general population, standardized incidence ratio (SIR) and respective 95 per cent confidence intervals (95 per cent CI) were calculated. We examined trends by calculating the annual percent change (APC) and corresponding 95 per cent CI. The analyses of the overall five-year survival after cancer diagnosis among children and adolescents with AIDS and that of the general population were based on the Kaplan-Meier product limit estimator and univariate Cox proportional hazards models. Choropleth maps on monochromatic scales were generated to describe the distribution of cases across the Municipality. Results: We identified 24 cases of cancer in patients with AIDS aged 20 years and younger, of which, 62.5 per cent were AIDS-defining malignancies. The most incident cancers were non-Hodgkin\'s lymphoma, including Burkitt\'s lymphoma (12; 50.0 per cent ), Hodgkin\'s lymphoma (6; 25.0 per cent ) and Kaposi sarcoma (3; 12.5 per cent ). The age-standardized incidence rate was 1,461.3 cases/million. The trend analyses revealed a significant reduction in the incidence of all cancers (APC= -14.5), driven by the decrease in AIDS-defining cancers (APC= -17.0). The overall risk for cancer was significantly increased (SIR= 3.9), especially for non-Hodgkin lymphoma, excluding Burkitts lymphoma (SIR= 22.5), Burkitt\'s lymphoma (SIR= 29.7) and Hodgkin\'s lymphoma (SIR= 18.7). The overall probability of survival at five years after cancer was 56.3 per cent in children and adolescents with AIDS versus 87.5 per cent in the general population. The hazard ratio for death was 5.2 (95 per cent CI= 2.0, 13.6). The map of the geographical distribution showed a concentration of cases in the low-income areas of the Municipality. Conclusion: There was a marked reduction in the incidence of AIDS-defining cancers, likely to be a result of the introduction of HAART. However, children and adolescents with AIDS remain at increased risk for the development of cancer when compared to the general population. For those who developed cancer, the risk of death was also significantly higher
6

Uso da técnica de linkage nos sistemas de informação em saúde: aplicação na base de dados do Registro de Câncer de base populacional do município de São Paulo / The use of the linkage technique in health information systems: application in the database of the São Paulo Population-based Cancer Registry

Stela Verzinhasse Peres 07 December 2011 (has links)
A disponibilidade de grandes bases de dados informatizadas em saúde tornou a técnica de relacionamento de fontes de dados, também conhecida como linkage, uma alternativa para diferentes tipos de estudos. Esta técnica proporciona a geração de uma base de dados mais completa e de baixo custo operacional. Objetivo- Investigar a possibilidade de completar/aperfeiçoar as informações da base de dados do RCBP-SP, no período de 1997 a 2005, utilizando o processo de linkage com três outras bases, a saber: Programa de Aprimoramento de Mortalidade (PRO-AIM), Autorização e Procedimentos de Alta Complexidade (APAC-SIA/SUS) e Fundação Sistema Estadual de Análise de Dados (FSeade). Métodos- Neste estudo foi utilizada a base de dados do RCBP-SP, composta por 343.306 com casos incidentes de câncer do município de São Paulo, registrados no período de 1997 a 2005, com idades que variaram de menos de um a 106 anos, de ambos os sexos. Para a completitude das informações do RCBP-SP foram utilizadas as bases de dados, a saber: PRO-AIM, APAC-SIA/SUS e FSeade. Foram utilizadas as técnicas de linkage probabilística e determinística. O linkage probabilístico foi realizado pelo programa Reclink III versão 3.1.6. Quanto ao linkage determinístico as rotinas foram realizadas em Visual Basic, com as bases hospedadas em SQL Server. Foram calculados os coeficientes brutos de incidência (CBI) e mortalidade (CBM) antes e após o linkage. A análise de sobrevida global foi realizada pela técnica de Kaplan-Meier e para na comparação entre as curvas, utilizou-se o teste de log rank. Foram calculados os valores da área sob a curva, sensibilidade e especificidade para determinar o ponto de corte do escore de maior precisão na identificação dos pares verdadeiros. Resultados- Após o linkage, verificou-se um ganho de 101,5 por cento para a variável endereço e 31,5 por cento para a data do óbito e 80,0 por cento para a data da última informação. Quanto à variável nome da mãe, na base de dados do RCBP-SP antes do linkage esta informação representava somente 0,5 por cento , tendo sido complementada, no geral, em 76.332 registros. A análise de sobrevida global mostrou que antes do processo de linkage havia uma subestimação na probabilidade de estar vivo em todos os períodos analisados. No geral, para a análise de sobrevida truncada em sete anos, a probabilidade de estar vivo no primeiro ano de seguimento antes do linkage foi menor quando comparada a probabilidade de estar vivo ao primeiro ano de seguimento após o linkage (48,8 por cento x 61,1 por cento ; p< 0,001). Conclusão- A técnica de linkage tanto probabilística quanto determinística foi efetiva para completar/aperfeiçoar as informações da base de dados do RCBP-SP. Além do mais, o CBI apresentou um ganho de 3,4 por cento . Quanto ao CBM houve um ganho de 25,8 por cento . Após o uso da técnica de linkage, foi verificado que os valores para a sobrevida global estavam subestimados para ambos os sexos, faixas etárias e para as topografias de câncer / The availability of large computerized databases on health has enabled the record linkage technique, an alternative for different study designs. This technique provides the generation of a more complete database, at low operational cost. Objective to investigate the possibility of completing/improving information from the database of the RCBP-SP, in the period between 1997 and 2005, using the record linkage technique with other three databases, namely: Mortality Improvement Program (PRO-AIM), Authorization of Highly Complex Procedures (APAC-SIA/SUS) and State System of Data Analysis (FSeade), comparing different strategies. Methods In this study we used the database of the RCBP-SP composed of 343,306 incident cancer cases in the Municipality of São Paulo registered in the period between 1997 and 2005 with ages raging from under one to 106 years, from both sexes. To complete the database of the RCBP-SP three databases were used, namely: PRO-AIM, APAC-SIA/SUS and FSeade. Both probabilistic and deterministic record linkage were used. Probabilistic linkage was performed using the Reclink III software, version 3.1.6. As for the the deterministic record linkage, the routines were run in the Visual Basic and databases hosted on a SQL Server. Before and after record linkage, crude incidence (CIR) and mortality rates (CMR) were calculated. The overall survival analysis was performed using the Kaplan-Meier technique and for the comparison between curves, the log rank test was employed. In order to determine the most precise cut-off scores in identifying true matches, we calculated the area under the curve, as well as, sensitivity and specificity. Results After record linkage, it was verified a gain of 101.5 per cent for the variable address, 31.5 per cent for death date and 80,0 per cent for the date of latest information. As for the variable mother´s name, in the database of the RCBP-SP before record linkage, this information represented only 0.5 per cent , having been completed, in general, in 76,332 registries. The overall survival analysis showed that before the record linkage there was an underestimation of the probability of being alive for all periods assessed. In general, for the truncated survival at seven years, the probability of being alive at the first year of follow up before record linkage was lower when compared to the probability of being alive at the first year of follow up after record linkage (48.8 per cent x 61.1 per cent ; p< 0.001). Conclusion Both the probabilistic and deterministic record linkage were effective to complete/improve information from the database of the RCBP-SP. Moreover, the CIR had a gain of de 3.4 per cent . As for the CMR, there was a gain of 25.8 per cent . After using the record linkage technique, it was verified that values for overall survival were underestimated for both sexes, all age groups, and cancer sites
7

A epidemiologia do câncer em crianças e adolescentes com Aids no Município de São Paulo: um estudo de base populacional / The cancer epidemiology in children and adolescents with AIDS in the Municipality of São Paulo: a population-based study

Luana Fiengo Tanaka 21 March 2017 (has links)
Introdução: A associação entre a infecção pelo vírus da imunodeficiência humana (HIV) e o câncer tem sido documentada desde os primórdios da epidemia da síndrome da imunodeficiência adquirida (Aids). A introdução da highly active antirretroviral therapy (HAART) alterou, profundamente, o curso da epidemia da Aids, reduzindo, drasticamente, a incidência de manifestações definidoras da síndrome, incluindo cânceres. No entanto, existem informações limitadas sobre a incidência de câncer em crianças e adolescentes com Aids vivendo em países em desenvolvimento. Objetivo: Descrever a epidemiologia do câncer em crianças e adolescentes com Aids no Município de São Paulo, no período de 1997 a 2012. Métodos: Trata-se de um estudo de base populacional, utilizando as bases de dados do Registro de Câncer de Base Populacional do Município de São Paulo e do Sistema de Informações de Agravos de Notificação (SINAN). As crianças e adolescentes (< 20 anos) com Aids e câncer foram identificadas por meio de um processo de linkage probabilístico entre as bases de dados supracitadas. Foram calculadas as taxas de incidência brutas e ajustadas por milhão de habitantes. Para comparar a incidência de câncer na população com Aids e a população geral foi calculada a razão de incidência padronizada (RIP) e respectivos intervalos de confiança de 95 por cento (IC 95 por cento ). A análise de tendência foi feita por meio do cálculo do annual percent change (APC) e IC 95 por cento correspondentes. A análise da sobrevida global de cinco anos após o câncer entre pacientes com Aids e na população geral foi calculada por meio do estimador produto limite de Kaplan-Meier e modelos univariados de riscos proporcionais de Cox. Mapas coropléticos em escalas monocromáticas foram gerados para descrever a distribuição de casos no Município. Resultados: Foram identificados 24 casos de câncer em pacientes com Aids menores de 20 anos, sendo 62,5 por cento cânceres definidores de Aids. Os cânceres mais incidentes foram o linfoma não Hodgkin, incluindo o linfoma de Burkitt (12; 50,0 por cento ), o linfoma de Hodgkin (6; 25,0 por cento ) e o sarcoma de Kaposi (3; 12,5 por cento ). A taxa bruta de incidência foi de 1.461,3 casos/milhão. A análise de tendência revelou redução significativa da incidência para todos os cânceres (APC= -14,5), influenciada pela queda nos cânceres definidores de Aids (APC= -17,0). O risco para câncer se mostrou aumentado (RIP= 3,9), sobretudo para o linfoma não Hodgkin, excluindo linfoma de Burkitt (RIP= 22,5), linfoma de Burkitt (RIP= 29,7) e linfoma de Hodgkin (RIP= 18,7). A probabilidade acumulada de sobrevida aos cinco anos foi de 56,3 por cento em crianças e adolescentes com Aids versus 87,5 por cento na população geral. A hazard ratio para óbito foi 5,2 (IC 95 por cento = 2,0; 13,6). O mapa da distribuição geográfica mostrou concentração dos casos nas áreas de classes sociais mais baixas do Município. Conclusão: Houve redução acentuada da incidência de cânceres definidores de Aids, como provável resultado da introdução da HAART. No entanto, crianças e adolescentes com Aids permanecem sob risco aumentado para o desenvolvimento de câncer quando comparadas à população geral. Para aquelas que desenvolveram câncer, o risco para óbito também se mostrou substancialmente elevado / Introduction: The association between human immunodeficiency virus (HIV) infection and cancer has been documented since the beginning of the epidemic of the acquired immunodeficiency syndrome (AIDS). The introduction of the highly active antiretroviral therapy (HAART) has profoundly altered the course of the AIDS epidemic, drastically reducing the incidence of AIDS-defining manifestations, including cancers. Nevertheless, there is limited information on the incidence of cancer in children and adolescents with AIDS living in developing countries. Objective: To describe the cancer epidemiology in children and adolescents with AIDS in the Municipality of São Paulo from 1997 to 2012. Methods: It is a population-based study, using the databases of the Population-based Cancer Registry of São Paulo and the Notifiable Diseases Information System (SINAN). Children and adolescents (< 20 years) with AIDS and cancer have been identified by means of a probabilistic record linkage process between the aforementioned databases. Crude and age-standardized incidence rates per million inhabitants were calculated. To compare the incidence of cancer in people with AIDS and that of the general population, standardized incidence ratio (SIR) and respective 95 per cent confidence intervals (95 per cent CI) were calculated. We examined trends by calculating the annual percent change (APC) and corresponding 95 per cent CI. The analyses of the overall five-year survival after cancer diagnosis among children and adolescents with AIDS and that of the general population were based on the Kaplan-Meier product limit estimator and univariate Cox proportional hazards models. Choropleth maps on monochromatic scales were generated to describe the distribution of cases across the Municipality. Results: We identified 24 cases of cancer in patients with AIDS aged 20 years and younger, of which, 62.5 per cent were AIDS-defining malignancies. The most incident cancers were non-Hodgkin\'s lymphoma, including Burkitt\'s lymphoma (12; 50.0 per cent ), Hodgkin\'s lymphoma (6; 25.0 per cent ) and Kaposi sarcoma (3; 12.5 per cent ). The age-standardized incidence rate was 1,461.3 cases/million. The trend analyses revealed a significant reduction in the incidence of all cancers (APC= -14.5), driven by the decrease in AIDS-defining cancers (APC= -17.0). The overall risk for cancer was significantly increased (SIR= 3.9), especially for non-Hodgkin lymphoma, excluding Burkitts lymphoma (SIR= 22.5), Burkitt\'s lymphoma (SIR= 29.7) and Hodgkin\'s lymphoma (SIR= 18.7). The overall probability of survival at five years after cancer was 56.3 per cent in children and adolescents with AIDS versus 87.5 per cent in the general population. The hazard ratio for death was 5.2 (95 per cent CI= 2.0, 13.6). The map of the geographical distribution showed a concentration of cases in the low-income areas of the Municipality. Conclusion: There was a marked reduction in the incidence of AIDS-defining cancers, likely to be a result of the introduction of HAART. However, children and adolescents with AIDS remain at increased risk for the development of cancer when compared to the general population. For those who developed cancer, the risk of death was also significantly higher

Page generated in 0.0936 seconds