Spelling suggestions: "subject:"microarrays"" "subject:"microarrrays""
151 |
Tensor generalizations of the singular value decomposition for integrative analysis of large-scale molecular biological dataOmberg, Larsson Gustaf, 1977- 28 August 2008 (has links)
Not available
|
152 |
Επίδραση της θερμοκρασίας ανάπτυξης στο ολικό μεταγραφικό πρότυπο πρώιμων ιχθυδίων zebrafish (Danio rerio, Hamilton 1822) / The effects of temperature to the total transcriptome of juvenille zebrafish (Danio rerio, Hamilton 1822)Μήτση, Ελένη 20 October 2009 (has links)
Σκοπός της έρευνας ήταν να μελετήσουμε την επίδραση της θερμοκρασίας στο ολικό μεταγράφωμα νυμφών zebrafish (Danio rerio, Hamilton 1822), θέλοντας να εστιάσουμε το ενδιαφέρον μας στη διερεύνηση μηχανισμών και μορίων που εμπλέκονται στο φυλοκαθορισμό του συγκεκριμένου ψαριού. Kατορθώσαμε να επιδράσουμε με τρεις διαφορετικές θερμοκρασίες σε μία θερμοκρασιακά ευαίσθητη οντογενετική περίοδο, η οποία οριοθετείται από την 10 έως την 20dpf. Η επιλογή των θερμοκρασιών έγινε με σημείο αναφοράς τους 28 ºC, η οποία είναι η πρότυπη θερμοκρασία ανάπτυξης των zebrafish. Η μελέτη της επίδρασης της θερμοκρασίας επιτεύχθη με διατήρηση των πειραματικών μας πληθυσμών σε θερμοκρασίες που αποκλίνουν κατά 4-6 ºC από την πρότυπη, δηλαδή στους 32 ºC και 22 ºC αντίστοιχα. Ως εκ τούτου, ολόκληρος ο πειραματικός πληθυσμός αναπτύχθηκε στη πρότυπη θερμοκρασία των 28 ºC μέχρι και την 10 dpf, όπου μετά την πάροδο της χωρίστηκε σε τρεις υπoπληθυσμούς καθένας από τους οποίους εκτέθηκε στους 22 ºC, 28 ºC ή 32 ºC αντίστοιχα για 280 θερμοημέρες (χρονική περίοδος :10-20dpf). Ακολούθησε δειγματοληψία (100 περίπου ατόμων) από κάθε υποπληθυσμό και εν συνεχεία πραγματοποιήθηκε απομόνωση ολικού RNA. Τα δείγματα μας υβριδοποιήθηκαν σε microarrays, τα οποία έφεραν αντιπροσωπευτικές αλληλουχίες για 15.500 γονίδια του zebrafish. Τα δεδομένα επεξεργάστηκαν με τη χρήση δυο εξειδικευμένων βιοπληροφορικών προγραμμάτων, τα Biosystanse και Dchip, με τη βοήθεια των οποίων συγκρίθηκαν οι εξής καταστάσεις: 10dpf _28 ºC με 20dpf _28 ºC, η οποία αποτελεί την αναπτυξιακή σύγκριση ώστε να ελέγξουμε γονίδια των οποίων η έκφραση αυξάνεται ή ελαττώνεται στα δυο αυτά στάδια αλλά και 20dpf_22 ºC με 20dpf_32 ºC, 20dpf_22 ºC με 20dpf_28 ºC και 20dpf_28 ºC με 20dpf_32 ºC, ώστε να παρατηρηθεί η επίδραση του περιβαλλοντικού παράγοντα ″θερμοκρασία″ στο μεταγράφωμα των ιχθυδίων. / The purpsose of this research was to analyse how temperature effects the total trascriptome at juvenile zebrash (Danio rerio, Hamilton 1822). So, we focus our investigation in the inspection of mechanisms and molecules which probably associated with the sex determination at this specific type of fish. We militated in the thermosensitive ontogenetic period ( from 10 to 20 days post fertilization) with three different temperatures. These three temperatures were 22, 28 and 32οC. Exemplary temperature for zebrafish is 28οC (environmental temperature). Initially, experimental population grew up to 28οC until the 10th day post fertilization. After this temporal period, population separated to three smaller experimental populations which of them grew up to 22, 28 and 32οC respectively for 280 thermodays ( chronic period: 10-20dpf). The next step was sampling (about 100 fish from each experimental population) and then isolating total RNA from each one of the samples. Total RNA samples hybridized on microarrays. Microarrays contained complementary sequences for about 15.500 genes of zebrafish genome. The data analyzed with two specific bioinformatics programs, Biosystance and Dchip. The use of these bioinformatics programs helped us comparing the following situations: 10dpf _28 ºC to 20dpf _28 ºC (developmental comparison) over and above 20dpf_22 ºC to 20dpf_32 ºC, 20dpf_22 ºC to 20dpf_28 ºC and 20dpf_28 ºC to 20dpf_32 ºC (temperature comparison).
|
153 |
Χρήση μικροσυστοιχιών DNA για την ανάλυση του μεταγραφικού προφίλ γενετικά τροποποιημένων εμβρυικών ινοβλαστών ποντικούΒερναρδής, Σπύρος - Ευγένιος 27 April 2009 (has links)
Η σύγκριση του μεταγραφικού προφίλ με χρήση μικροσυστοιχιών DNA είναι μια τεχνική που βελτιστοποιήθηκε την τελευταία δεκαετία. Η διαδικασία μπορεί να διαχωριστεί σε δύο μέρη: το πειραματικό και το υπολογιστικό. Το πρώτο μέρος αφορά στα βήματα της επιλογής της μικροσυστοιχίας, της απομόνωσης του βιολογικού υλικού, της σήμανσης και της επέκτασης, της υβριδοποίησης και της σάρωσης. Το υπολογιστικό μέρος αφορά στην ποσοτικοποίηση της εικόνας, στην κανονικοποίηση των δεδομένων και στην ανάλυσή τους. Πριν από τα παραπάνω βήματα πρέπει να έχει διατυπωθεί το κατάλληλο βιολογικό ερώτημα. Το βιολογικό ερώτημα που τέθηκε αφορούσε στις διαφορές στη γονιδιακή έκφραση των γενετικά τροποποιημένων εμβρυικών ινοβλαστών του ποντικού οι οποίοι έφεραν έλλειψη του ενός αλληλομόρφου της πρωτεΐνης Geminin σε σύγκριση με ομόζυγους εμβρυικούς ινοβλάστες. Για το σκοπό αυτό επιλέχθηκε μικροσυστοιχία δοκιμής με 384 ανιχνευτές γονιδίων ποντικού σε διπλά αντίγραφα. Απομονώθηκε ολικό RNA από τα κύτταρα, σημάνθηκε με απ’ ευθείας σήμανση και οι cDNA στόχοι που προέκυψαν, υβριδοποιήθηκαν στη μικροσυστοιχία. Έπειτα από δοκιμές καθορίστηκαν οι κατάλληλες συνθήκες για ένα ολοκληρωμένο πείραμα σύγκρισης μεταγραφικού προφίλ. Στη συνέχεια, πραγματοποιήθηκε προκαταρκτική ανάλυση του πειράματος η οποία περιελάμβανε ποσοτικοποίηση της εικόνας που προέκυψε, κανονικοποίηση των δεδομένων και πολυπαραμετρική ανάλυσή τους. / Transcriptional profiling using DNA microarrays was optimized during the last decade. The process can be separated in two parts: the experimental part and the computational part. The first part includes the steps of microarray choice, isolation of the biological material, labeling and amplification, hybridization and scanning. The computational part includes image quantification, data normalization and data analysis. Before the above steps, an appropriate biological question should be formulated. We wished to study differences in the gene expression profile of genetically modified mouse embryonic fibroblasts bearing a knock – out allele of the Geminin gene (homozygote|+/- Gem), in comparison to wild type embryonic fibroblasts. For this reason, a trial microarray was chosen with 384 gene probes in duplicates. Total RNA was isolated from the cells, directly labeled and the cDNA targets synthesized were hybridized to the microarray. After a series of trials, optimal conditions for a complete transcriptional profiling experiment were determined. Initial analysis including quantification of the image, data normalization and further multifunctional analysis was then carried out.
|
154 |
Επεξεργασία εικόνων cDNA μικροσυστοιχιών βασισμένη σε μετασχηματισμούς κυματιδίων και τυχαίων πεδίων Markov / Complementary DNA microarray image processing based on wavelets and Markov random fields modelsΜάντουκας, Θεόδωρος 27 April 2009 (has links)
Οι μικροσυστοιχίες συμπληρωματικού DNA (cDNA) αποτελούν αποδοτικά και αποτελεσματικά μέσα για την ταυτόχρονη ανάλυση της λειτουργίας δεκάδων χιλιάδων γονιδίων. Μια τυπική cDNA εικόνα μικροσυστοιχιών αποτελεί μια συλλογή πράσινων και κόκκινων κηλίδων (spots) που περιέχουν DNA. Κάθε κηλίδα καταλαμβάνει ένα μικρό τμήμα της εικόνας, με τη μέση τιμή της έντασης της κηλίδας να είναι στενά συνδεδεμένη με το επίπεδο έκφρασης του αντίστοιχου γονιδου. Η κύρια διαδικασία υπολογισμού της έντασης περιλαμβάνει τρία στάδια: Διευθυνσιοδότηση ή κατασκευή πλέγματος (gridding), κατάτμηση (Segmentation) και τέλος η διαδικασία εξαγωγής έντασης.
Στη παρούσα εργασία, η διευθυνσιοδότηση πραγματοποιήθηκε χρησιμοποιώντας μια αυτόματη τεχνική κατασκευής πλέγματος στηριζόμενη στον συνεχή μετασχηματισμό κυματιδίων (CWT). Ποιο συγκεκριμένα,, υπολογίστηκαν τα προφίλ του χ και y άξονα της εικόνας. Δεύτερον, εφαρμόστηκε, σε κάθε προφίλ, ο CWT μετασχηματισμός εώς το 15 επίπεδο, χρησιμοποιώντας daubechies 4 (db4) ως μητρικό κυματίδιο. Τρίτον, υπολογίστηκε το άθροισμα των 15 επιπέδων για κάθε ένα από τα δύο σήματα x και y. Τέταρτον, εφαρμόστηκε στα δύο νέα σήματα τεχνική καταστολής θορύβου με χρήση μετασχηματισμού Wavelet. Τελικά, το κέντρο και όρια της κάθε κηλίδας καθορίστηκαν μέσω του υπολογισμού των τοπικών ελαχίστων και μέγιστων του κάθε σήματος.
Για την κατάτμηση της εικόνας, μια νέα μέθοδος προτάθηκε, η οποία διακρίνεται σε τρία βασικά βήματα: Πρώτον, ο à trous μετασχηματισμός κυματιδίων (AWT) εφαρμόστηκε έως το δεύτερο επίπεδο στην αρχική εικόνα. Δεύτερον, στις λεπτομέρειες (details coefficients) του κάθε επιπέδου εφαρμόστηκε φίλτρο καταστολής θορύβου, προκειμένου να υποβαθμιστεί ο θόρυβος. Τρίτον, η αρχική εικόνα μαζί με τις προσεγγίσεις (approximations) και τις λεπτομέρειες (details) του κάθε επιπέδου εφαρμόστηκαν σε ένα συλλογικό σχήμα (ensemble scheme) στηριζόμενο στο MRF μοντέλο κατάτμησης. Ως τελεστές του σχήματος χρησιμοποιήθηκαν οι: Majority Vote , Min, Product και Probabilistic Product.
Η αξιολόγηση των προτεινόμενων αλγορίθμων πραγματοποιήθηκε με τη χρήση υψηλής ποιότητας εικόνας προσομοίωσης αποτελούμενη από 1040 κηλίδες (spots) με ρεαλιστικά μορφολογικά χαρακτηριστικά, η οποία δημιουργήθηκε σύμφωνα με το μοντέλο προσημείωσης μικροσυστοιχιών του Matlab καθώς και 14 πραγματικές εικόνες, επτά 16-bit grayscale TIFF εικόνες από κάθε κανάλι (κόκκινο και πράσινο), οι οποίες αποκτήθηκαν από την ευρέως διαδεδομένη βάση δεδομένων DERICI. Επιπλέον, προκειμένου να παρατηρηθεί η συμπεριφορά των αλγορίθμων στη παρουσία θορύβου, η απομιμούμενη εικόνα υποβαθμίστηκε με τη προσθήκη λευκού Gaussian θορύβου.
Η ακρίβεια της ακολουθούμενης διαδικασίας κατάτμησης, στη περίπτωση της εικόνας προσομοίωσης, προσδιορίστηκε μέσω του segmentation matching factor (SMF), probability of error (PE) και coefficient of determination (CD) με σεβασμό στη πραγματική κλάση στην οποία ανήκουν (φόντο-υπόβαθρο). Στη περίπτωση των πραγματικών εικόνων η αξιοπιστία των αλγορίθμων προσδιορίστηκε έμμεσα μετρώντας την ένταση κάθε κηλίδας, μέσω του Mean Absolute Error (MAE).
Το σύνολο των αλγορίθμων, εφαρμοσμένο στην απομιμούμενη εικόνα, κατάφερε να οδηγήσει σε καλύτερο προσδιορισμό των κηλίδων σε σχέση με το απλό MRF μοντέλο κατάτμησης. Επιπλέον, ο τελεστής Majority Vote επέτυχε το υψηλότερο ποσοστό σε όλες τις περιπτώσεις, ειδικά σε κελία (cells) με υψηλή παρουσία θορύβου (SMF: 82.69%, PE: 6.60% and CV:0.809 ), ενώ το απλό μοντέλο περιορίστηκε στο χαμηλότερο ποσοστό (SMF:94.87%-82.69%, PE:3.03%-9.85%, CV:0.961-0.729). Στη περίπτωση των πραγματικών εικόνων ο min τελεστής επέτυχε το χαμηλότερο ποσοστό (MAE: 803.96 and Normalized MAE: 0.0738), σε αντίθεση με τον τελεστή Majority Vote, ο οποίος κατάφερε να επιτύχει το υψηλότερο ποσοστό ανάμεσα στους χρησιμοποιούμενους τελεστές (MAE 990.49 and Normalized MAE 0.0738).Επιπλέον όλοι οι προτεινόμενοι αλγόριθμοι κατάφεραν να μειώσουν τη μέση τιμή MAE σε σχέση με το απλό μοντέλο MRF (MAE 1183.50 and Normalized MAE 0,0859). / Complementary DNA microarrays are a powerful and efficient tool that uses genome sequence information to analyze the structure and function of tens of thousands of genes simultaneously. A typical cDNA microarray image is a collection of green and red discrete spots containing DNA. Each spot occupies a small fraction on the image and its mean fluorescence intensity is closely related to the expression level of the genes. The main process for measuring spot intensity values involves three tasks: gridding, segmentation and data extraction.
In the present study, spot location was accomplished by using an automatic gridding method based on continues wavelet transform (CWT): Firstly, line-profiles for x and y axes were calculated. Secondly, the CWT was applied up to 15 scales to both profiles by using daubechies 4 (db4) as mother wavelet. Thirdly, a summation point by point of the signals of all the 15 scales was calculated. Fourthly, a hard-thresholding wavelet based technique was applied to each signal. Finally, spots centers and boundaries were defined by calculating the local maxima and the local minima on both signals.
The proposed segmentation method is divided into three major steps: Firstly,
à trous wavelet transform was applied up to second scale on the initial cell. Secondly, on the details coefficients, a hard threshold filter was carried out in order to suppress the noise. Finally, the initial image among the approximations and details of each scale were implemented in an ensemble scheme based on MRF model. As operators of the ensemble scheme were chosen: Majority Vote, Min, Product and Probabilistic Product.
The validation of the proposed algorithms was accomplished by a high quality simulated microarray image of 1040 cells with realistic morphological characteristics generated by using the Matlab microarray simulation model and fourteen real cDNA microarray images, seven 16-bit grayscale TIFF images of both channels (green and red), collected from the DERICI public database. In order to investigate the performance of the algorithms in presence of noise, the simulated image was corrupted with additive white Gaussian noise.
In the case of simulated image, the segmentation accuracy was evaluated by means of segmentation matching factor, probability of error and coefficient of determination in respect to the pixel actual classess (foreground-background pixels). In the case of real images the evaluation was based on Mean Absolute error (MAE), in order to measure indirectly their reliability.
According to our results in simulated cells, the proposed ensemble schemes managed to lead to more accurate spot determination in comparison to conventional MRF model. Additionally, the majority vote operator managed to accomplish the highest score in all cases, especially on cells with high noise (SMF: 82.69%,
PE: 6.60% and CV:0.809), while the conventional MRF managed to gather the lowest score in all cases (SMF:94.87%-82.69%, PE:3.03%-9.85%, CV:0.961-0.729). In the case of real images, the min operator achieved the lowest score (MAE: 803.96 and Normalized MAE: 0.0738) in contrast to majority vote, which reached the highest score among the proposed evaluating methods (MAE 990.49 and Normalized MAE 0.0738). Additionally, all the proposed algorithms managed to suppress MAE value compared to the conventional MRF segmentation model (MAE 1183.50 and Normalized MAE 0,0859).
|
155 |
Multivariate classification of gene expression microarray dataBotella Pérez, Cristina 26 May 2010 (has links)
L'expressiódels gens obtinguts de l'anàliside microarrays s'utilitza en molts casos, per classificar les cèllules. En aquestatesi, unaversióprobabilística del mètodeDiscriminant Partial Least Squares (p-DPLS)s'utilitza per classificar les mostres de les expressions delsseus gens. p-DPLS esbasa en la regla de Bayes de la probabilitat a posteriori. Aquestsclassificadorssónforaçats a classficarsempre.Per superaraquestalimitaciós'haimplementatl'opció de rebuig.Aquestaopciópermetrebutjarlesmostresamb alt riscd'errors de classificació (és a dir, mostresambigüesi outliers).Aquestaopció de rebuigcombinacriterisbasats en els residuals x, el leverage ielsvalorspredits. A més,esdesenvolupa un mètode de selecció de variables per triarels gens mésrellevants, jaque la majoriadels gens analitzatsamb un microarraysónirrellevants per al propòsit particular de classificacióI podenconfondre el classificador. Finalment, el DPLSs'estenen a la classificació multi-classemitjançant la combinació de PLS ambl'anàlisidiscriminant lineal.
|
156 |
The Identification of BRCA1 and BRCA2 Mutation Carriers Using Functional Genomic AssaysMichel, CLAIRE S. 14 April 2009 (has links)
An estimated 5-10% of breast cancers are hereditary in nature and are due to the presence of a mutation in a breast cancer predisposition gene; approximately half of these cases possess a mutation in BRCA1 or BRCA2. Many BRCA1/BRCA2 mutations result in a truncated protein and hence are unequivocally disease-causing. However another class of mutations, the Variants of Unknown Significance (VUS), are more problematic as the effect of these mutations on protein function is unclear. The inability to classify these mutations as disease causing generates significant problems in risk evaluation, counseling and preventive care. Accordingly we sought to determine whether carriers of either a BRCA1 or BRCA2 mutation could be identified from non-carriers based on the gene expression patterns of non-cancerous cells.
EBV-transformed lymphoblastoid cell lines established from BRCA1/BRCA2 mutation carriers and normal individuals were obtained through the NIH Breast Cancer Family Registries. Cell lines were mock-irradiated or treated with ionizing radiation (2 Gy). Following a recovery period of 6 hours total RNA was extracted and whole genome gene expression profiling was carried out. Molecular classifiers comparing the baseline expression profiles and the radiation-dependent expression profiles of BRCA1/BRCA2 mutation carriers to control individuals were created using a Support Vector Machine (SVM) coupled with a recursive feature removal (RFR) algorithm.
Our results suggest that cell populations derived from BRCA1/BRCA2 mutation carriers display unique expression phenotypes from those of control individuals in both the basal and radiation-induced cases. In the task of classification using baseline expression, the BRCA1-classifier correctly classified 15/18 test samples using feature selection based on the training set only, while feature selection using the entire dataset (AD) improved classification to 16/18 samples. The BRCA2-baseline classifier correctly classified 13/17 and 14/17 (AD) samples, respectively. In the task of radiation-dependent classification, the BRCA1-IR classifier correctly classified 12/18 and 16/18 (AD) test samples respectively while the BRCA2-IR classifier correctly classified 13/17 and 16/17 (AD) test samples respectively. These results suggest the possibility of development of this assay into a novel hereditary breast cancer screening diagnostic able to accurately identify the presence of BRCA1 or BRCA2 mutations via a functional assay thereby improving patient outcomes. / Thesis (Master, Pathology & Molecular Medicine) -- Queen's University, 2008-03-27 15:38:19.269 / Canadian Breast Cancer Foundation-Ontario Chapter,
Department of Pathology & Molecular Medicine Clinical Trust Fund
|
157 |
Exploration of high-density oligoarrays as tools to assess substantial equivalence of genetically modified cropsBeaulieu, Julie. January 2005 (has links)
Since the early 1990s, the concept of substantial equivalence has been a guiding principle of the Canadian Food Inspection Agency and Health Canada's regulatory approach toward products of plant biotechnology destined for the food and livestock feed markets. To assess substantial equivalence in terms of chemical composition, genetically modified (GM) plants are compared to conventional counterparts at the level of macro- and micro-nutrients, allergens and toxicants. Such targeted comparative analyses are limited in their scope and their capacity to detect unintended changes in chemical composition. There is a need to develop more effective testing protocols to improve the substantial equivalence assessment of GM crops. The objective of this thesis was to explore high-density oligoarrays as tools to assess substantial equivalence of Roundup Ready(TM) soybean. Three conventional and two GM soybean varieties were selected according to the similarity of their performance in field trials. Total RNA was extracted from first trifoliate leaves harvested from soybean plants grown in a controlled environment until the V2 stage. To annotate the 37 776 soybean probesets present on the multi-organism Soybean Affymetrix GeneChip(TM), consensus sequences were aligned with TIGR Soybean Gene Index tentative consensus sequences using BLASTN. After redefining the chip description file to exclude non-soybean probesets, the effects of three different normalization methods (Robust Multichip Average (RMA), Microarray Analysis Suite (MAS 5.0) and Model-Based Expression Index) were compared and Significance Analysis of Microarrays (SAM for R-Bioconductor) was applied to detect differential gene expression between conventional and GM soybean varieties. Eleven candidate genes were selected for further studies.
|
158 |
Molecular Characterisation of the Brassinosteroid, Phytosulfokine and cGMP-dependent Responses in Arabidopsis thalianaKwezi, Lusisizwe January 2010 (has links)
<p>In this thesis, we have firstly cloned and expressed the domains that harbours the putative catalytic GC domain in these receptor molecules and demonstrate that these molecules can convert GTP to cGMP in vitro. Secondly, we show that exogenous application of both Phytosulfokine and Brassinosteroid increase changes of intracellular cGMP levels in Arabidopsis mesophyll protoplast demonstrating that these molecules have GC activity in vivo and therefore provide a link as second messenger between the hormones and down-stream responses. In order to elucidate a relationship between the kinase and GC domains of the PSK receptor, we have used the AtPSKR1 receptor as a model and show that it has Serine/Threonine kinase activity using the Ser/Thr peptide 1 as a substrate. In addition, we show that the receptor`s ability to phosphorylate a substrate is affected by the product (cGMP) of its co-domain (GC) and that the receptor autophosphorylates on serine residues and this step was also observed to be affected by cGMP. When Arabidopsis plants are treated with a cell permeable analogue of cGMP, we note that this can affect changes in the phosphoproteome in Arabidopsis and conclude therefore that the cGMP plays a role in kinase-dependent downstream signalling. The obtained results suggest that the receptor molecules investigated here belong to a novel class of GCs that contains both a cytosolic kinase and GC domains, and thus have a domain organisation that is not dissimilar to that of atrial natriuretic peptide receptors NPR1 and NPR2. The findings also strongly suggest that cGMP has a role as a second messenger in both Brassinosteroid and Phytosulfokine signalling. We speculate that other proteins with similar domain organisations may also have dual catalytic activities and that a significant number of GCs, both in plants and animals, remain to be discovered and characterised.</p>
|
159 |
A VISUALIZATION TOOL FOR CROSS-EXPERIMENT GENE EXPRESSION ANALYSIS OF C. ELEGANSXue, Lin 01 January 2007 (has links)
Forty-six genomic gene expression studies of free living soil nematode C. eleganshave been published. To facilitate exploratory analysis of those studies, we constructed adatabase containing all the published C. elegans expression datasets. A Perl CGIprogram, called Microarray Analysis Display (MAdisplay), allows gene expressionclustergrams of any combination of entered genes and datasets to be viewed(http://elegans.uky.edu/gl/madisplay). Perl programs were used to preprocess the rawdata from different sources into a common format and to transform the data to displaythe expression changes relative to each experiment's controls. Three hundred lists ofgenes from figures and tables were extracted from the publications and made available inthe GeneLists database, which also contains Gene Ontology and KEGG gene lists. Weused these tools to examine in a systematic fashion the mean expression of gene lists inthe set of microarray and SAGE experiments. Seventy-nine percent of publicationderived gene lists show a strong expression change (p-value andlt;0.001) in more than oneexperiment with the median being fourteen out of the 127 experiments that are derivedfrom the forty-six publications. This indicates that groups of genes identified in onepublication typically show an expression effect in many other experiments.
|
160 |
Gene expression analysis of microarray data : a case study of papilllary thyroid carcinoma dataBegum, Mst. Ferdouse January 2007 (has links)
Microarray technology allows researchers to monitor the mRNA transcription levels of thousands of genes in parallel which opens the door for more advanced cancer research. This thesis focuses on a case study of papillary thyroid carcinoma data. Fourteen publicly available Affymetrix microarray data sets were used where seven samples were collected from normal thyroid tissue and the remaining seven were collected from papillary thyroid carcinoma tissue. The present study compared the results obtained from three different normalization processes: MAS5.0, RMA and GCRMA in detecting differentially expressed genes under two conditions. Internal consistencies within the methods as well as the results across three methods were compared. Statistical packages 82.5.1 and Bioconductor 2.08 are used to perform the data analysis. Each step of normalization with MAS5.0 and RMA is described. Statistical package Limma is used to fit a linear model. Finally an empirical Bayes method is used to detect the significantly differentially expressed genes. First, considering all genes a comparison is made among the three normalization methods where RMA and GCRMA showed the maximum agreement in detecting differentially expressed genes. Then using unspecified filtering process a set of genes was selected and the whole process was replicated where the top fifty differentially expressed genes did not show any overlap with each other. / Department of Mathematical Sciences
|
Page generated in 0.0244 seconds