Spelling suggestions: "subject:"differentially expressed"" "subject:"differentially cxpressed""
11 |
Estudo da expressão das proteínas cromodomínio-helicase e SET/TAF-Iβ durante o processo de estrobilização de Mesocestoides cortiCosta, Caroline Borges January 2013 (has links)
A cromodomínio-helicase (CHD) e a SET/TAF-Iβ (chaperona de histonas) são proteínas conhecidas por estarem envolvidas em processos de remodelagem de cromatina e controle da expressão gênica. Em organismos como Caenorhabditis elegans, Drosophila melanogaster, camundongo e o homem, estas proteínas estão associadas ao controle de vários processos de desenvolvimento. Em Mesocestoides corti, um modelo de parasito cestódeo, sequências relacionadas à CHD e à SET/TAF-Iβ foram identificadas em uma seleção de genes diferencialmente expressos em larvas e vermes estrobilizados. Visando à identificação de marcadores moleculares de processos e estágios de desenvolvimento da Classe Cestoda, os padrões de expressão de ortólogos das proteínas CHD e SET/TAF-Iβ (McCHD e McSET/TAF) em M. corti foram investigados. Inicialmente as sequências codificadoras da McCHD e McSET/TAF foram amplificadas por RT-PCR, clonadas em vetor de expressão modificado (pGEX-TEV) e expressas em Escherichia coli para produção de proteínas recombinantes. Análises por imunoblot e imuno-histoquímica foram realizadas utilizando anticorpos gerados contra versões recombinantes das proteínas-alvo do estudo. Foram analisados quatro estágios de desenvolvimento de M. corti: larvas (tetratirídeos, TT), TT após 24h de indução ao processo de estrobilização (o qual confere o desenvolvimento da larva em adulto) (24h-Ind), TT após 72h de indução (72h-PI) e vermes estrobilizados (VE). Em imunoblots, a McCHD apresentou altos níveis de expressão em três estágios de desenvolvimento de M. corti: TT, 72h-PI e VE, sendo detectado um menor nível de expressão no estágio 24h-Ind quando comparado aos demais. Já a McSET/TAF apresentou um aumento gradual no seu nível de expressão após a indução (nos estágios de 24h-Ind, 72h-PI e VE), não sendo detectada em TT. Em secções longitudinais foram observados um maior nível de expressão da McCHD em estágios iniciais de desenvolvimento (TT e 24- Ind) enquanto que McSET/TAF foi observado um maior nível de expressão nos estágios intermediários e no final do desenvolvimento de M. corti. Para ambas as proteínas a localização foi citoplasmática e não houve diferenças de distribuição nos tecidos analisados. Para compreender melhor as diferenças encontradas nos níveis de expressão das proteínas, análises por PCR em tempo real (RT-qPCR) foram realizadas para quantificação dos níveis de transcritos dos genes McCHD e McSET/TAF. Foram encontradas diferenças significativas nos níveis de expressão gênica de McCHD e McSET/TAF somente em dois estágios: o inicial (TT) e o adulto (VE), conforme análises pelo teste de Duncan. Níveis maiores de expressão gênica de ambos os genes foram encontrados no último estágio de desenvolvimento (VE) de M. corti. A caracterização de genes e proteínas envolvidas no processo de estrobilização de platelmintos da classe Cestoda contribuirá para o melhor entendimento de rotas do desenvolvimento de cestódeos, podendo auxiliar também na determinação de novos alvos terapêuticos para o tratamento de cestodíases. / Chromodomain-helicase (CHD) and the SET/TAF-Iβ histone chaperone are proteins known to be implicated in processes of chromatin remodeling and regulation of gene expression associated with the control of developmental processes in different organisms, such as Caenorhabditis elegans, Drosophila melanogaster, mouse and human. In Mesocestoides corti, a model cestode parasite, CHD and SET/TAF-Iβ related sequences were isolated in a screening for genes differentially expressed in larvae (tetrathyridia) and adult worms. Aiming at identifying molecular markers of processes and stages of development of Class Cestoda, the expression patterns of M. corti CHD and SET/TAF-Iβ orthologous proteins (McCHD and McSET/TAF) were investigated. Initially, the coding sequences of McCHD and McSET/TAF were amplified by RT-PCR, cloned into a modified expression vector (pGEX-TEV) and expressed in Escherichia coli for recombinant proteins production. Analysis by immunoblotting and immunohistochemistry was performed using antibodies raised against recombinant versions of the proteins target the study. We analyzed four developmental stages of M. corti: bona fide tetrathyridia (TT), tetrathyridia 24 h after strobilation induction (24h-Ind), strobilating worms 72 h after induction (72h-PI), and fully strobilated worms (VE). Immunoblots showed high levels of expression McCHD in three developmental stages of M. corti: TT, 72h-PI e VE, and detected a lower level of expression in stage 24-Ind in comparison to others. The McSET/TAF showed a gradual increase in their level of expression after induction (stages of 24h-Ind, 72h- PI e VE) was not detected in TT. In longitudinal sections were observed an increased level of expression of McCHD in early stages of development (TT and 24-Ind) while McSET/TAF there was a higher level of expression in the intermediate and late stages of development of M. corti. Both McCHD and McSET/TAF showed a cytoplasmic location and a uniform pattern of immunostaining, no differences in distribution between the tissues. For a better understanding the differences in levels of protein expression, analysis by real-time PCR (RT-qPCR) was performed to quantify the transcript levels of genes McCHD and McSET/TAF. There were significant differences in levels of gene expression McCHD and McSET/TAF only in two stages: the initial (TT) and adult (VE), as analysis by Duncan test. Higher levels of gene expression of both genes were found in the last stage of development (VE) of M. corti. The characterization of genes and proteins involved in the process of strobilation flatworms of the class Cestoda contribute to a better understanding of the development of cestodes routes and may also assist in the determination of new therapeutic targets for the treatment of cestodiasis.
|
12 |
Desenvolvimento Diferencial Casta-Específico das Pernas Posteriores de Apis mellifera. / Differential Hind Leg Development in Apis mellifera Castes.Ana Durvalina Bomtorin 11 March 2009 (has links)
A diferenciação morfofisiológica entre rainhas e operárias de Apis mellifera decorre da alimentação recebida durante o desenvolvimento larval, que estimula o aumento da produção de Hormônio Juvenil naslarvas que originarão rainhas. Dentre as diversas diferenças morfológicas entre operárias e rainhas encontramse estruturas especializadas para a coleta de pólen e própolis, localizadas na região da tíbia e do basitarso das pernas posteriores de operárias. A diferenciação das pernas tem início entre o quarto e o quinto estágio do desenvolvimento larval. Utilizandose Microscopia Eletrônica de Varredura o presente trabalho relata a presença das cerdas formando as estruturas castaespecíficas na fase de pupa de olho marrom. A partir de estudos de hibridação de microarrays de cDNA com amostras de RNA de A. mellifera de diversas fases do desenvolvimento larval, foram encontrados 91 genes com ortólogos conhecidos em Drosophila, diferencialmente expressos entre rainhas e operárias no período crítico da diferenciação de castas. Destes, cinco estão relacionados com o desenvolvimento de apêndices: ataxin2 (atx2), cryptocephal (crc), dachshund (dac), grunge (gug) e Retinoic and fat acid Binding Protein (RfaBP). O perfil destes genes, e ainda, ultrabithorax (ubx), distalless(dll) e abdominalA (abdA) (estes porsuassuasfunções durante a diferenciação das pernas de insetos) foram analisados por RTPCR em Tempo Real em pernas posteriores de operárias e rainhas desde o quarto estágio larval até o estágio de pupa de olho branco. Apenas ubx e abdA foram encontrados mais expressos em operárias ao final do desenvolvimento larval e início do desenvolvimento pupal. Estudossimilares dos genes abdA, dac, dll e ubx nossegmentos das pernas de pupas de olho branco indicam a tíbia como domínio de expressão de dac. Imunolocalizações utilizando um anticorpo contra um epitopo conservado entre Ubx e AbdA, FP6.87, em pernas posteriores de prépupas de operárias e rainhasrevelam a presença destas proteínas na tíbia apenas de operárias e diferencialmente localizadas no basitarso de operárias e rainhas. Os dados acima apresentados apontam Ubx, um gene Hox, como pontochave na regulação da formação das estruturas castaespecíficas. / Diphenism in the honey bee, Apis mellifera,resultsfromdifferential feeding of female larvae. Among the morphological differences, the hind legs of workers have structures that is used for carrying pollen and propolis, e.g. the corbicula, while the queens hind legslack thisstructures. The corbicula is an expanded region of the tibia deprived of bristles, which has a single bristle in the middle that seems to have a sensorial function. Using scanning electronic microscopy, we found that the leg structures and bristles of the corbicula are already formed in browneyed pupa. Microarray analysis has demonstrated that five of 240 differentiallyexpressed genesin developing castes are potentially related to the caste differences in leg development (ataxin2, cryptocephal, dachshund, grunge and Retinoic and fat acid Binding Protein). Using qPCR, we analyzed the expression of abdominalA, ataxin2, cryptocephal, grunge, Retinoic and fat acid Binding Protein and ultrabithorax genes during hind leg development. cryptocephal, ataxin2, grunge and Retinoic and fat acid Binding Protein genes, which are involved in imaginal disc elongation and bristle formation and are inhibited by juvenile hormone, were not found to be differentially expressed. However, ultrabithorax and abdominalA are over expressed in workersin the early pupalstage. By using immunohistochemistry, Ubx was localized in the tibia and basitarsus of prepupae of workers and in the basitarsus of pre pupae of queens. The pattern of Ubx expression suggests that this Hox gene is a key player in leg structuresformation and caste differentiation in A.mellifera.
|
13 |
The effect of normalization methods on the identification of differentially expressed genes in microarray dataKristinsson, Vilhelm Yngvi January 2007 (has links)
In this thesis the effect of normalization methods on the identification of differentially expressed genes is investigated. A zebrafish microarray dataset called Swirl was used in this thesis work. First the Swirl dataset was extracted and visualized to view if the robust spline and print tip loess normalization methods are appropriate to normalize this dataset. The dataset was then normalized with the two normalization methods and the differentially expressed genes were identified with the LimmaGUI program. The results were then evaluated by investigating which genes overlap after applying different normalization methods and which ones are identified uniquely after applying the different methods. The results showed that after the normalization methods were applied the differentially expressed genes that were identified by the LimmaGUI program did differ to some extent but the difference was not considered to be major. Thus the main conclusion is that the choice of normalization method does not have a major effect on the resulting list of differentially expressed genes.
|
14 |
Evaluation of Some Statistical Methods for the Identification of Differentially Expressed GenesHaddon, Andrew L 24 March 2015 (has links)
Microarray platforms have been around for many years and while there is a rise of new technologies in laboratories, microarrays are still prevalent. When it comes to the analysis of microarray data to identify differentially expressed (DE) genes, many methods have been proposed and modified for improvement. However, the most popular methods such as Significance Analysis of Microarrays (SAM), samroc, fold change, and rank product are far from perfect. When it comes down to choosing which method is most powerful, it comes down to the characteristics of the sample and distribution of the gene expressions. The most practiced method is usually SAM or samroc but when the data tends to be skewed, the power of these methods decrease. With the concept that the median becomes a better measure of central tendency than the mean when the data is skewed, the tests statistics of the SAM and fold change methods are modified in this thesis. This study shows that the median modified fold change method improves the power for many cases when identifying DE genes if the data follows a lognormal distribution.
|
15 |
Comparative transcriptome profiling of human and pig intestinal epithelial cells after Deltacoronavirus infectionCruz Pulido, Diana Patricia 30 September 2020 (has links)
No description available.
|
16 |
Identifying Differentially Expressed Human Lung MicroRNAs and Their Molecular FunctionsLimbu, Sarita 23 December 2009 (has links)
No description available.
|
17 |
Análise transcritômica de amostras humanas naturalmente infectadas por virus Chikungunya / Transcriptional analysis of human samples naturally infected by Chikungunya virusCruz, Natália Baptista 05 August 2019 (has links)
A Febre de Chikungunya é uma doença sistêmica causada por arbovírus e estima-se que afete cerca de 1 milhão de pessoas anualmente. Os principais sintomas associados com esta doença são febre e poliartralgia, podendo esta última assumir um caráter crônico em cerca de metade dos casos. Devido aos inúmeros surtos que ocorreram nos últimos 50 anos, diversos estudos tiveram como objetivo determinar os mecanismos de replicação do vírus e da resposta imune. Mesmo assim, pouco se sabe sobre quais moléculas possibilitam o processo de infecção. Já foi demonstrada a importância de interferons, principalmente de tipo I, citocinas e quimiocinas na diminuição da replicação viral. Além disso, há uma preferência do vírus por tipos celulares específicos como células endoteliais e epiteliais. Porém, estudos mostram informações contraditórias referentes ao papel de células mononucleares do sangue periférico (PBMC), principalmente com relação a monócitos e células B e T. Diante deste contexto, o tratamento utilizado atualmente é direcionado apenas ao alívio de sintomas uma vez que não existem drogas ou vacinas licenciadas específicas para esta doença. Logo, o objetivo deste trabalho é estudar as modificações transcricionais que ocorrem em amostras humanas durante o processo de infecção pelo vírus de Chikungunya de modo a esclarecer os mecanismos utilizados pelo sistema imune em resposta a infecção. Além disso, este estudo tem como finalidade apontar possíveis diferenças transcricionais entre amostras crônicas e não-crônicas. / The Chikungunya Fever is a systemic disease transmitted by arboviruses and is estimated to affect 1 million people annually. The main symptoms associated with this disease are fever and polyarthralgia, which can develop to chronic features in about half of the cases. Due to outbreaks that occurred in the last 50 years, many studies had the goal of determining the mechanisms of virus replication and immune response. Nevertheless, it is still poorly understood which molecules enable the ocurrence of the infection process. It has already been shown the importance of interferons, mainly type I, cytokines and chemokines in restricting the viral replication. In addition, the Chikungunya virus shows a preference for specific cell types such as endothelial and epithelial cells. However, studies display contradictory information regarding the role of peripheral blood mononuclear cells (PBMC), mainly in relation to monocytes and B and T cells. Given this context, the treatment currently used is directed only to alleviate the symptoms since there are no specific licensed drugs or vaccines for this disease. Therefore, the objective of this work was to study the transcriptional modifications that occur in humans during the process of Chikungunya virus infection in order to clarify the mechanisms used by the immune system. In addition, it aims to point out possible transcriptional differences between sample from the Chronic and Non-Chronic acute phase of the infection.
|
18 |
Johnson's system of distributions and microarray data analysisGeorge, Florence 01 June 2007 (has links)
Microarray technology permit us to study the expression levels of thousands of genes simultaneously. The technique has a wide range of applications including identification of genes that change their expression in cells due to disease or drug stimuli. The dissertation is addressing statistical methods for the selection of differentially expressed genes in two experimental conditions. We propose two different methods for the selection of differentially expressed genes. The first method is a classical approach, where we consider a common distribution for the summary measure of equally expressed genes. To estimate this common distribution, the Johnson system of distribution is used. The advantage of using Johnson system is that, there is no need of a parametric assumption for gene expression data. In contrast to other classical methods, in the proposed method, there is a sharing of information across the genes by the assumption of a common distribution for the summary measure of equally expressed genes. The second method is the gene selection using a mixture model approach and Baye's theorem. This approach also uses the Johnson System of distribution for the estimation of distribution of summary measure. Johnson system of distribution has the flexibility of covering a wide variety of distributional shapes. This system provides a unique distribution corresponding to each pair of mathematically possible values of skewness and kurtosis. The significant flexibility of Johnson system is very useful in characterizing the complicated data set like microarray data. In this dissertation we propose a novel algorithm for the estimation of the four parameters of the Johnson system.
|
19 |
Identificação de genes candidatos à indução do florescimento em cana-de-açúcar em câmara de fotoperíodo / Identification of candidates genes for flowering induction in sugarcane in photoperiod chamberMelloni, Maria Letícia Guindalini [UNESP] 15 December 2015 (has links)
Submitted by MARIA LETICIA GUINDALINI MELLONI null (letmell@yahoo.com.br) on 2016-01-14T15:02:04Z
No. of bitstreams: 1
Tese_Maria_Letícia_Guindalini_Melloni.pdf: 683985 bytes, checksum: 53424c1e6da45d38a2d516aeb0a405fd (MD5) / Rejected by Juliano Benedito Ferreira (julianoferreira@reitoria.unesp.br), reason: Solicitamos que realize uma nova submissão seguindo as orientações abaixo:
A versão do trabalho submetida ao Repositório Institucional UNESP deve conter o texto completo. A Coordenadoria Geral de Bibliotecas se encarregará de disponibilizar apenas o conteúdo parcial que segundo a Portaria UNESP 396 de 10 de setembro de 2015 consiste em:
Artigo 3º
V - conteúdo parcial: as páginas pré-textuais (a folha de rosto, a dedicatória, os agradecimentos, a epígrafe, o resumo na língua vernácula, o resumo em língua estrangeira, as listas de ilustrações, de tabelas, de abreviaturas, de siglas e de símbolos e o sumário), a introdução, a conclusão ou as considerações finais e as referências do trabalho.
Lembrando que: é necessário informar no formulário de submissão que a versão do trabalho a ser disponibilizada deve ser a parcial e indicar em quanto tempo a versão integral deverá ser disponibilizada, ao atingir a data limite o sistema automaticamente disponibilizará a versão completa do trabalho. Caso necessite prorrogar o prazo para disponibilização do texto completo, de acordo com o artigo 6º da Portaria UNESP 396:
A data para a disponibilização do conteúdo integral poderá ser prorrogada por até mais 2 (dois) anos mediante a apresentação, via ofício, de justificativa pelo Autor ao programa de pós-graduação com no mínimo 90 (noventa) dias de antecedência à data informada para a disponibilização do conteúdo integral.
Agradecemos a compreensão. on 2016-01-18T11:30:25Z (GMT) / Submitted by MARIA LETICIA GUINDALINI MELLONI null (letmell@yahoo.com.br) on 2016-01-18T11:52:00Z
No. of bitstreams: 1
Tese_Maria_Letícia_Guindalini_Melloni.pdf: 1866484 bytes, checksum: 4990d42ce801ec4b8fe8d516cb7568d4 (MD5) / Approved for entry into archive by Juliano Benedito Ferreira (julianoferreira@reitoria.unesp.br) on 2016-01-18T13:48:32Z (GMT) No. of bitstreams: 1
melloni_mlg_dr_jabo_par.pdf: 733459 bytes, checksum: d8b36f206c9b78d184a6e2627f86b26d (MD5) / Made available in DSpace on 2016-01-18T13:48:32Z (GMT). No. of bitstreams: 1
melloni_mlg_dr_jabo_par.pdf: 733459 bytes, checksum: d8b36f206c9b78d184a6e2627f86b26d (MD5)
Previous issue date: 2015-12-15 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Com o intuito de aumentar o conhecimento da rede gênica envolvida no controle do florescimento em cana-de-açúcar, diferentes cultivares de cana-de-açúcar foram submetidos a tratamentos fotoperiódicos de indução e não indução do florescimento em câmara de fotoperíodo. Aos 5, 10 e 20 dias de indução, a folha +1 e a bainha foliar foram coletadas para a identificação de fragmentos diferencialmente expressos (FDEs) por meio da técnica de cDNA-AFLP entre e dentro dos tratamentos fotoperiódicos. Um total de 162 fragmentos foram selecionados e reamplificados. Destes, 63 FDEs tiveram sucesso na reação de reamplificação e foram clonados e sequenciados. As sequências foram confrontadas com seis bancos de sequências: 1. Transcritos do projeto SUCEST ;2. Proteínas do genoma de sorgo; 3. BAC de cana-de-açúcar; 4. Proteínas do genoma de arroz, 5. Proteínas presentes no Phytozome e 6. NCBI. A busca por similaridade se deu pelo uso da ferramenta BLASTn (e-value 1e-5) nos casos do banco SUCEST e dos BACs de cana-de-açúcar e BLASTx (e-value 1e-5) para os demais bancos. Dentre os 63 FDEs, 23 corresponderam a sequências de genes enquanto os outros 40 representam sequências que não estão depositadas nestes bancos (no hits). A maioria das 23 sequencias apresenta similaridade com genes que codificam proteínas hipotéticas ou preditas em diversos organismos. Com base na análise do domínio da proteína realizada pelo Pfam, seis sequências podem estar associadas ao metabolismo da indução do florescimento. Dentre estas as sequencias LM-19, LM-40 e LM-53 se destacaram. A LM-19 possui similaridade com o gene que codifica uma proteína com o domínio DNAJ sendo que proteína com este domínio é considerada mediador da integração dos sinais do florescimento em Arabidopsis thaliana. LM-40 possui similaridade com o gene que codifica proteína de domínio (F-BOX); estudos indicam forte relação deste domínio aos processos de indução ao florescimento. LM-53 tem um domínio de proteína predita semelhante ao domínio da proteína codificada pelo gene CONSTANS que regula a expressão de FLOWERING LOCUS T (FT), que codifica o florígeno em Arabidopsis thaliana e em algumas outras espécies. De maneira geral, a técnica do cDNA-AFLP foi eficiente, na identificação de FDEs ao longo dos tratamentos fotoperiódicos de indução e não indução do florescimento. Os resultados obtidos sugerem que as sequencias LM-19, LM-40 e LM-53 estão vinculadas aos metabolismos de indução do florescimento. É provável que a maioria dos FDEs obtidos possam estar envolvidos nos metabolismos da indução do florescimento, porém ainda não foram identificados na literatura. / In order to increase the knowledge of the gene network involved in sugarcane flowering induction, sugarcane cultivars were submitted to different photoperiod treatments of flowering induction and non-induction in a photoperiod facility. At 5, 10 and 20 days of induction, the +1 leaf and the leaf sheath were collected for the identification of different transcript-derived fragments (TDFs) within and between the photoperiod treatments to apply the cDNA-AFLP technique. A total of 162 TDFs were selected and re-amplified. Of these, 63 TDFs were successful in re-amplification and were cloned and sequenced. The sequences were confronted against 6 sequence databanks (SUCEST transcripts; Sorghum genome proteins; Sugarcane BACs; proteins from rice genome; Phytozome and NCBI). Similarity search was done by using the BLASTn (e-value 1e-5) tool for the SUCEST databank and sugarcane BACs while BLASTx (e-value 1e-5) was use for the other banks. Among the 63 TDFs, 23 corresponded to gene sequences while the remaining 40 represent sequences that are not deposited in these banks (no hits). The majority of the 23 sequences showed similarity with genes coding for hypothetical or predicted proteins of different organisms. Based on the protein domain analysis conducted by Pfam, six sequences may be associated with flowering induction metabolism. Among these: LM-19, LM-40 and LM-53 sequences stood out. LM-19 has similarity to the gene encoding a protein with DnaJ domain. Proteins having this domain are considered as an integrating floral signals mediator in Arabidopsis thaliana. LM-40 has similarity to the gene encoding a protein with (F-BOX) domain. This domain has a strong relationship in flowering induction processes. LM-53 has one of the predicted protein domain similar to the domain of the protein encoded by the CONSTANS gene which governs the expression of FLOWERING LOCUS T (FT), this later one encodes the florigen. Generally the cDNA-AFLP technique was effective in identifying TDFs across the flowering inductive and non-inductive photoperiodic treatments. The results suggest that LM-19, LM-40 and LM-53 sequences are linked to flowering induction metabolisms. Probably, most of the TDF here obtained may be involved in the flowering induction metabolism, although not yet been identified in the literature. / FAPESP: 2013/24020-0
|
20 |
Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq / Influence of the number of repetitions in the identification of differentially expressed genes in RNA-Seq experimentsGonçalves, Jaciane Coelho 16 January 2013 (has links)
Made available in DSpace on 2015-03-26T13:32:18Z (GMT). No. of bitstreams: 1
texto completo.pdf: 619084 bytes, checksum: 33699c369d9fd3f595c40375c27f4c43 (MD5)
Previous issue date: 2013-01-16 / One of the current objectives of molecular biology is to measure and assess the gene expression profiles in different types of biological tissues, to understand the mechanisms of molecular transformation under certain conditions. Next-generation sequencing (NGS) technologies promote DNA sequencing in platforms capable of generating information about millions of base pairs in a single step. However these technologies still have high cost, making it difficult to obtain large number of repetitions of sample data. Therefore, it becomes necessary the discovery and the improvement of efficient statistical methodologies for optimizing analysis of data generated in genome sequencing platforms. The overall objective of this work was to evaluate the effect of the number of repetitions in the identification of differentially expressed genes, in RNA-Seq experiments, contributing to the clarification of the statistic that researchers will assist in data analysis in RNA-Seq experiments. Specifically, we evaluate empirically the effect of the number of repetitions in the statistical analysis of gene expression in RNA-Seq experiments. To carry out the analyses we used a dataset defined in Li et al. (2008), which compared treated and non-treated cancer cells. That work had four biological replications for the control group (non-treated) and three replications for biological treatment group (cells that have received the treatment). The data was analyzed using the package DESeq from the statistical environment R. A total of 2566 genes were considered differentially expressed (DE) when we evaluate the original and complete dataset. When we analyzed three replications of the control and treatment, we found, on average, 2153 genes DE. From the moment in which only two reps for both treatments were used, were identified, on average, 1241 genes DE. The major change in the number of genes DE was observed when replications were not used. In this case we identified around 44 differentially expressed genes. According to the results generated in the analysis, it was possible to verify that the number of repetitions is an essential factor in order to obtain a significant number of differentially expressed genes. / Um dos objetivos atuais da biologia molecular é medir e avaliar os perfis de expressão gênica em diferentes tipos de tecidos biológicos, para entender os mecanismos de transformação molecular sob determinadas condições. Tecnologias de sequenciamento de Nova Geração (NGS) promovem o
sequenciamento de DNA em plataformas capazes de gerar informações sobre milhões de pares de bases em uma única etapa. Porém essas tecnologias ainda apresentam custo elevado, dificultando a obtenção de elevado número de repetições de dados amostrais. Assim, torna-se necessária a descoberta
e o aprimoramento de metodologias estatísticas eficientes para a otimização das análises de dados gerados em plataformas de sequenciamento de genomas. O objetivo geral desse trabalho consistiu em avaliar o efeito do número de repetições na identificação de genes diferencialmente expressos, em
experimentos de RNA-Seq, contribuindo para o esclarecimento de pesquisadores que venham a auxiliar nas análises de dados em experimentos de RNA-Seq. De forma específica, avaliamos
empiricamente o efeito do número de repetições na análise estatística da expressão gênica em experimentos de RNA-Seq. Para a realização das análises foi utilizado um conjunto de dados definido em Li et al. (2008), o qual comparou células cancerígenas tratadas e não tratadas. Naquele estudo
havia quatro repetições biológicas para o grupo controle (células não tratadas) e três repetições biológicas para grupo de tratamento (células que receberam o tratamento). Os dados foram analisados utilizando o pacote DESeq do Programa computacional R. Um total de 2566 genes foram considerados diferencialmente expressos (DE) quando avaliamos o conjunto de dados original completo. Quando analisamos três repetições do controle e do tratamento, nós encontramos, em média, 2153 genes DE. A partir do momento em que apenas duas repetições para ambos os tratamentos foram utilizadas, foram identificadas, em média, 1241 genes DE. A grande alteração no número de genes DE foi observada quando repetições não foram utilizadas. Nesse caso identificamos em torno de 44 genes diferencialmente expressos. De acordo com os resultados gerados nas análises,
foi possível verificar que o número de repetições é um fator essencial para se obter um número significativo de genes diferencialmente expressos.
|
Page generated in 0.08 seconds