Global ETD Search

541	A runtime system for data-flow task programming on multicore architectures with accelerators / Uma ferramenta para programação com dependência de dados em arquiteturas multicore com aceleradores / Vers un support exécutif avec dépendance de données pour les architectures multicoeur avec des accélérateurs Lima, João Vicente Ferreira January 2014 (has links) Dans cette thèse , nous proposons d’étudier des questions sur le parallélism de tâche avec dépendance de données dans le cadre de machines multicoeur avec des accélérateurs. La solution proposée a été développée en utilisant l’interface de programmation haute niveau XKaapi du projet MOAIS de l’INRIA Rhône-Alpes. D’abord nous avons étudié des questions liés à une approche d’exécution totalement asyncrone et l’ordonnancement par vol de travail sur des architectures multi-GPU. Le vol de travail avec localité de données a montré des résultats significatifs, mais il ne prend pas en compte des différents ressources de calcul. Ensuite nous avons conçu une interface et une modèle de coût qui permettent d’écrire des politiques d’ordonnancement sur XKaapi. Finalement on a évalué XKaapi sur un coprocesseur Intel Xeon Phi en mode natif. Notre conclusion est double. D’abord nous avons montré que le modèle de programmation data-flow peut être efficace sur des accélérateurs tels que des GPUs ou des coprocesseurs Intel Xeon Phi. Ensuite, le support à des différents politiques d’ordonnancement est indispensable. Les modèles de coût permettent d’obtenir de performance significatifs sur des calculs très réguliers, tandis que le vol de travail permet de redistribuer la charge en cours d’exécution. / Esta tese investiga os desafios no uso de paralelismo de tarefas com dependências de dados em arquiteturas multi-CPU com aceleradores. Para tanto, o XKaapi, desenvolvido no grupo de pesquisa MOAIS (INRIA Rhône-Alpes), é a ferramenta de programação base deste trabalho. Em um primeiro momento, este trabalho propôs extensões ao XKaapi a fim de sobrepor transferência de dados com execução através de operações concorrentes em GPU, em conjunto com escalonamento por roubo de tarefas em multi-GPU. Os resultados experimentais sugerem que o suporte a asincronismo é importante à escalabilidade e desempenho em multi-GPU. Apesar da localidade de dados, o roubo de tarefas não pondera a capacidade de processamento das unidades de processamento disponíveis. Nós estudamos estratégias de escalonamento com predição de desempenho em tempo de execução através de modelos de custo de execução. Desenvolveu-se um framework sobre o XKaapi de escalonamento que proporciona a implementação de diferentes algoritmos de escalonamento. Esta tese também avaliou o XKaapi em coprocessodores Intel Xeon Phi para execução nativa. A conclusão desta tese é dupla. Primeiramente, nós concluímos que um modelo de programação com dependências de dados pode ser eficiente em aceleradores, tais como GPUs e coprocessadores Intel Xeon Phi. Não obstante, uma ferramenta de programação com suporte a diferentes estratégias de escalonamento é essencial. Modelos de custo podem ser usados no contexto de algoritmos paralelos regulares, enquanto que o roubo de tarefas poder reagir a desbalanceamentos em tempo de execução. / In this thesis, we propose to study the issues of task parallelism with data dependencies on multicore architectures with accelerators. We target those architectures with the XKaapi runtime system developed by the MOAIS team (INRIA Rhône-Alpes). We first studied the issues on multi-GPU architectures for asynchronous execution and scheduling. Work stealing with heuristics showed significant performance results, but did not consider the computing power of different resources. Next, we designed a scheduling framework and a performance model to support scheduling strategies over XKaapi runtime. Finally, we performed experimental evaluations over the Intel Xeon Phi coprocessor in native execution. Our conclusion is twofold. First we concluded that data-flow task programming can be efficient on accelerators, which may be GPUs or Intel Xeon Phi coprocessors. Second, the runtime support of different scheduling strategies is essential. Cost models provide significant performance results over very regular computations, while work stealing can react to imbalances at runtime. Programmation parallèle Accélérateur Parallélisme de tâche Dépendance de données Vol de travail Arquitetura : Computadores Processamento paralelo Parallel programming Accelerators Task parallelism Data flow dependencies Work stealing
542	Sistema de alta precisão para as medições dos campos magneticos dispositivos de inserção do Laboratorio Nacional de Luz Sincroton / High precision system for magnetic field measurements of insertion devices of the Brazilian Synchroton Light Source Tosin, Giancarlo 12 May 2005 (has links) Orientador: Evandro Conforti / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e Computação / Made available in DSpace on 2018-08-06T03:26:36Z (GMT). No. of bitstreams: 1 Tosin_Giancarlo_D.pdf: 3627033 bytes, checksum: 259c4fdcd684f17b9b0a0dbe346d2342 (MD5) Previous issue date: 2005 / Resumo: As medições acuradas e precisas do campo magnético dos dispositivos de inserção (DIs) são essenciais para garantir que suas instalações no Anel de Armazenamento de Elétrons do Laboratório Nacional de Luz Síncrotron (LNLS) alcançarão o desempenho desejado e não comprometerão a estabilidade do feixe de elétrons estocado. Tais dispositivos são versáteis fontes de radiação introduzidas nos Anéis de Armazenamento onde, a partir dos seus perfis de campos, promovem a emissão de intensos fluxos de fótons, de largo espectro ou monocromáticos, cuja polarização também pode ser controlada. Devido às características do feixe de elétrons do Anel de Armazenamento do LNLS, tais como energia de operação, energia de injeção e abertura dinâmica (região onde o feixe é estável), severas restrições na qualidade do campo são impostas para garantir o tempo de vida e a estabilidade da órbita. Para a verificação dessas especificações e do perfil do campo, que é fundamental para a determinação do espectro emitido, construiu-se uma bancada de caracterização com alcance útil de 4,2 m. Duas técnicas foram nela instaladas: bobina girante, para a medida de campos médios (ou integrados), e sensores Hall, para a medição de campos locais. Ambas as técnicas foram exploradas nos seus conceitos, e aperfeiçoadas, a fim de assegurar a confiabilidade dos valores medidos, dentro de suas especificações. O aperfeiçoamento das técnicas aqui proposto permitiu melhorar substancialmente a precisão apresentada na literatura especializada / Abstract: This Thesis was a consequence of the need for an accurate and precise magnetic field measurement bench for insertion devices characterization (IDs). Such devices are versatile radiation sources installed in Electron Storage Rings. From their magnetic field profile, they provide high photon fluxes, with broad or monochromatic spectrum, being possible, depending on the ID geometry, to control also the radiation polarization. Due to some features of the LNLS electron beam, such as injection energy, operation energy and dynamic aperture, severe restrictions are imposed on the magnetic field quality to assure a long life time and a stable beam orbit. A characterization bench, 4.2 m in length, was built to verify such specifications and to determine the field profile, which is correlated to the emission spectrum. Two techniques were implemented in this bench: rotating coil, for average (or integrated) field measurements, and Hall probes, for local field measurements. Both techniques were conceptually explored and improved to guarantee the reliability of the measured values within their specifications. The results showed a considerable increasing in the precision with respect to values presented in the scientific literature / Doutorado / Eletrônica, Microeletrônica e Optoeletrônica / Doutor em Engenharia Elétrica Aneis de armazenamento Dispositivos magnéticos Hall, Efeito Bobinas Detectores Aceleradores de partículas Particle storage rings Magnetic devices Hall effect Coils, Electric Detectors Accelerators, Particle
543	Determinação da taxa de desintegração e das probabilidades de emissão ga por decaimento do I-123 / Desintegration rate and gamma ray emission probability per decay measurement of sup(123)I GISHITOMI, KAROLINE C. 09 October 2014 (has links) Made available in DSpace on 2014-10-09T12:35:06Z (GMT). No. of bitstreams: 0 / Made available in DSpace on 2014-10-09T14:00:42Z (GMT). No. of bitstreams: 0 / Neste trabalho foi desenvolvido o método de padronização do 123I em sistema de coincidências 4π(X,A)-γ. O 123I foi produzido no cíclotron Cyclone-30 do IPEN CNEN/SP, por meio da irradiação do 124Xe. O 123I decai com uma meia vida de 13,22 horas pelo processo de captura eletrônica seguido da emissão de radiação gama. Foi aplicada a técnica de extrapolação linear da eficiência para determinação da atividade e para determinação do coeficiente de conversão interna total do nível de 159 keV, obtido a partir da inclinação da curva de extrapolação. A curva de extrapolação experimental foi comparada com a simulação de Monte Carlo, executada pelo código ESQUEMA. As fontes radioativas foram também medidas em um sistema de espectrometria de HPGe, a fim de determinar a probabilidade de emissão gama por decaimento para várias transições gama. Todas as incertezas envolvidas e suas correlações foram analisadas aplicando a metodologia de matriz de covariância e os parâmetros medidos foram comparados com os da literatura. / Dissertação (Mestrado) / IPEN/D / Instituto de Pesquisas Energeticas e Nucleares - IPEN-CNEN/SP radiation protection radiation doses radiation monitoring gamma radiation emission spectroscopy decay monte carlo method cyclic accelerators cyclotrons program management iodine 123 isotope production brazil
544	Eletrodesintegração do sup(232)Th por emissão de um nêutron TERREMOTO, LUIS A.A. 09 October 2014 (has links) Made available in DSpace on 2014-10-09T12:54:05Z (GMT). No. of bitstreams: 0 / Made available in DSpace on 2014-10-09T14:09:02Z (GMT). No. of bitstreams: 1 12444.pdf: 2861377 bytes, checksum: f197a83330e61c5fa6654676c3363a7f (MD5) / Dissertacao (Mestrado) / IPEN/D / Instituto de Fisica, Universidade de Sao Paulo - IF/USP activation analysis experimental data linear accelerators mev range 01-10 mev range 10-100 neutron emission performance photonuclear reactions thorium 232
545	Oxidação eletroquímica do ácido fórmico em eletrólito ácido e básico utilizando eletrocatalisadores PtBi/C e PdBi/C preparados pelo método de redução via borohidreto de sódio adição rápida / Electrochemical oxidation of formic acid in acid and alkaline electrolyte using electrocatalysts PtBi/C and PdBi/C prepared via sodium borohydride reduction method in a fast manner YOVANOVICH, MARCOS 11 November 2016 (has links) Submitted by Claudinei Pracidelli (cpracide@ipen.br) on 2016-11-11T09:51:24Z No. of bitstreams: 0 / Made available in DSpace on 2016-11-11T09:51:24Z (GMT). No. of bitstreams: 0 / PtBi/C e PdBi/C foram preparados em diferentes razões atômicas (100:0, 90:10, 80:20, 70:30, 60:40 e 50:50) pelo método de redução via borohidreto de sódio (com adição total da solução de borohidreto em uma única etapa) utilizando H2PtCl6.6H2O, Pd(NO3)2, (BiNO3)3.5H2O como fonte de metais, Vulcan® (XC72-Cabot) como suporte de carbono e com uma carga metálica correspondente a 20% em massa. Os eletrocatalisadores obtidos foram caracterizados por difração de raios-X (DRX), microscopia eletrônica de transmissão (MET) e voltametria cíclica (VC). A atividade dos diferentes materiais preparados para a oxidação eletroquímica do ácido fórmico foi realizada em eletrólito ácido e alcalino utilizando-se as técnicas de voltametria cíclica, e cronoamperometria. Para estes estudos foi utilizado a técnica do eletrodo de camada fina porosa. A caracterização eletroquímica permitiu comparar o desempenho eletroquímico da platina e paládio, além de avaliar o benefício da presença do bismuto nas razões atômicas propostas. Os difratogramas de raio-X (DRX) confirmaram para todos os compostos de PtBi/C e PdBi/C a formação da estrutura cúbica de face centrada (cfc) característicos da rede cristalina da platina e do Paládio respectivamente. Outros picos encontrados foram associados a presença de fases de óxido de bismuto em ambos os compostos, PtBi/C e PdBi/C. A microscopia eletrônica de transmissão (MET) indicou que a presença de maiores teores de bismuto não acarretaram em aumento do tamanho médio da partícula. Os resultados eletroquímicos em meio alcalino indicaram que ainda é necessário uma otimização da concentração de ácido fórmico para que possamos observar melhores resultados quanto à adição de bismuto na platina ou paládio, no entanto os estudos em meio ácido mostraram o efeito benéfico da adição de bismuto tanto para platina quanto para o paládio. / Dissertação (Mestrado em Tecnologia Nuclear) / IPEN/D / Instituto de Pesquisas Energeticas e Nucleares - IPEN-CNEN/SP borohydrides hydrogen compounds sodium hydroxides vulcan facility formic acid reduction electrolytes electrocatalysts x-ray diffraction transmission electron microscopy cyclic accelerators electrochemical coating bismuth oxides platinum oxides palladium oxides
546	Desenvolvimento de um Guia orientativo para dosimetria em Tomografia Computadorizada / Development of a guidance guide for dosimetry in computed tomography FONTES, LADYJANE P. 10 March 2017 (has links) Submitted by Maria Eneide de Souza Araujo (mearaujo@ipen.br) on 2017-03-10T16:07:58Z No. of bitstreams: 0 / Made available in DSpace on 2017-03-10T16:07:58Z (GMT). No. of bitstreams: 0 / Devido as frequentes dúvidas dos usuários das câmaras de ionização do tipo lápis calibradas no Laboratório de Calibração de Instrumentos do IPEN (LCI IPEN), em como aplicar corretamente os fatores indicados em seus certificados de calibração, foi elaborado um guia orientativo para dosimetria em tomografia computadorizada. O guia orientativo inclui o conhecimento prévio da Camada Semirredutora (CSR), já que é necessário conhecer a energia efetiva do feixe para aplicação do fator de correção para qualidade (kq). A avaliação da CSR em tomógrafos torna-se uma difícil tarefa devido à geometria do sistema e por essa razão foi realizado um levantamento das metodologias existentes para a determinação da CSR em feixes clínicos de Tomografia Computadorizada (TC), levando em consideração fatores técnicos, práticos e econômicos. Neste trabalho, optou-se em testar um Sistema Tandem composto por capas absorvedoras confeccionado na oficina do IPEN, baseado em estudos preliminares devido ao baixo custo e boa reposta. O Sistema Tandem é composto por 5 capas absorvedoras cilíndricas de 1 mm, 3 mm, 5 mm, 7 mm, e 10 mm de alumínio e por 3 capas absorvedoras cilíndricas de 15 mm, 25 mm e 35 mm de acrílico (PMMA) acopladas à câmara de ionização do tipo lápis comercial amplamente utilizada em testes de controle de qualidade na dosimetria em feixes clínicos de Tomografia Computadorizada. Através das curvas Tandem, foi possível avaliar os valores de CSR e, através da curva de calibração da câmara de ionização do tipo lápis, encontrar o Kq adequado ao feixe. O Guia elaborado traz informações de como construir a curva de calibração em função da CSR, para encontrar o Kq, bem como informações para construção da curva Tandem, para encontrar valores próximos de CSR. / Dissertação (Mestrado em Tecnologia Nuclear) / IPEN/D / Instituto de Pesquisas Energeticas e Nucleares - IPEN-CNEN/SP dosimetry patients computerized tomography tandem electrostatic accelerators semiconductor detectors ionization chambers isodose curves calibration radiography images diagnosis therapy nuclear medicine recommendations
547	Eletronterapia intraoperatória adjuvante no carcinoma inicial invasivo de mama: tolerabilidade, satisfação estética e eficiência terapêutica / Adjuvant intraoperative electron-beam therapy for early invasive breast carcinoma: toxicity, therapeutic efficacy and aesthetic satisfaction Samir Abdallah Hanna 31 January 2014 (has links) INTRODUÇÃO: A razão para a radioterapia parcial da mama em comparação ao tratamento convencional da mama inteira baseia-se em 3 pontos: a) cerca de 90% das recidivas locais ocorre na adjacência do tumor primário; b) é possível estabelecer a equivalência de efetividade entre a dose única e o tratamento fracionado convencional; e c) existem dificuldades logísticas, financeiras e emocionais no tratamento fracionado convencional (falta da disponibilidade do aparelho de radioterapia em muitos municípios e desistência de tratamento das mulheres que iniciam a radioterapia convencional). Em maio de 2004 iniciou-se um estudo prospectivo com a eletronterapia intraoperatória adjuvante no carcinoma inicial invasor de mama, porém com sistemática de tratamento diferente de outras técnicas: ao invés de se usar um acelerador linear portátil e dedicado, utilizou-se o acelerador linear estático convencional. Neste trabalho, buscou-se analisar a frequência de complicações imediatas e tardias; o grau de satisfação estética das pacientes com as mamas após o tratamento; e as taxas de sobrevida livre de doença e sobrevida livre de falha local. MÉTODOS: Coletaram-se dados dos prontuários, buscando informações demográficas, do estadiamento inicial, da avaliação histopatológica intraoperatória (margens cirúrgicas e linfonodo sentinela), dados técnicos da eletronterapia e os achados finais em exame de parafina. Além disso, a frequência de complicações imediatas (até um mês de cirurgia) e tardias (depois de um mês), a estética (um ano da cirurgia, usando a escala de Harvard/NSABP/RTOG) e finalmente os índices de sobrevida global e livre de evento. RESULTADOS: Foram incluídas 169 pacientes e destas 35 foram excluídas devido a critérios intraoperatórios (linfonodo sentinela positivo ou margens positivas). Assim, 134 foram analisadas com idade mediana de 57,9 (40-85,4) anos, em um seguimento mediano de 50,6 (1-97,2) meses. Quatro pacientes desenvolveram recidiva local e três tiveram recorrência regional. As estimativas actuariais em 5 anos de sobrevida global, livre de eventos e livre de falha local foram respectivamente 97, 90,5 e 93,6%. A incidência cumulativa de falha local em 5 anos foi de 3,7%. A incidência global de toxicidade aguda foi de 8,2% e tardia de 26,2%. Os resultados estéticos excelentes, bons, regulares e ruins observados foram respectivamente 70,9%, 14,2%, 3,7% e 3,0%. Os tamanhos de colimador utilizados foram 4 cm em 18,7%, 5 cm em 80,6% e 7 cm de 0,7% dos casos. A energia de elétrons escolhida para tratamento foi de 6 MeV em 7,4%, 9 MeV em 52,2%, 12 MeV em 35,8%, 15 MeV em 3,7%, e 18 MeV em 0,7%. Os aceleradores lineares dedicados apresentam opção de energia de elétron variando até 9 MeV. Sendo assim, 40,29% dessa amostra provavelmente seria sub-tratada em equipamentos dedicados, pois foram necessários valores maiores de energia de elétrons para um tratamento adequado. Todas as pacientes fizeram portal-filme para checagem antes do tratamento e em 72,4% o alinhamento entre o disco de proteção e o colimador foi suficiente. No entanto, 27,6% das pacientes tiveram que ter os discos reposicionados. Nenhum caso de infecção no período perihospitalar fora observado. CONCLUSÕES: A eletronterapia intraoperatória com acelerador linear convencional apresentou baixa frequência de complicações e resultados estéticos desfavoráveis, e foi oncologicamente efetiva / INTRODUCTION: The rationale for partial breast radiation therapy when compared to conventional whole breast treatment is based on three points: a) about 90% of local recurrences occur in the adjacent area of the primary tumor, b) it is possible to establish equivalence between the effectiveness of single dose and fractionated conventional treatment, and c) there are logistical, financial and emotional difficulties related to conventional fractionated treatment (lack of availability of radiotherapy facilities in many cities and the high dropout rate of women who start conventional radiotherapy). In May 2004 we started a prospective trial using adjuvant intraoperative electron-beam therapy in early invasive breast cancer, but instead of a dedicated linear accelerator, we used the static conventional linear accelerator. In this study, we aimed to analyze the frequency of early and late complications, the cosmetic satisfaction of patients after treatment, and freedom from disease and local recurrence rates. METHODS: Data were collected from medical records, looking for demographic information, the initial stage, intraoperative and definitive histopathological evaluation of surgical margins and sentinel lymph node, technical data and pathologic staging, and follow-up data. In addition, the frequency of immediate (up to one month of surgery) and late (after one month) complications, aesthetics (one year of surgery, using the scale of Harvard/NSABP/RTOG), and finally the event-free and overal survival were obtained. RESULTS: We included 169 patients and 35 of these were excluded due to intraoperative criteria (positive sentinel lymph nodes or margins). Thus, 134 were analyzed. The median age was 57.9 (40 to 85.4) years and the median follow-up was 50.6 (1 to 97.2) months. Four patients developed local recurrence and three had regional recurrence. The actuarial estimates for overall, event-free, and local failure-free survivals were respectively 97, 90.5, and 93.6%. The crude incidence of local failure at 5 years was 3.7%. The overall incidences of acute and late toxicities were respectively 8.2% and 26.2%. The cosmetic results as excellent, good, fair and bad respectively were observed in 70.9%, 14.2%, 3.7% and 3.0%. Collimator sizes were 4 cm in 18.7%, 5 cm in 80.6%, and 7 cm in 0.7% of cases. The electron energy chosen for treatment was 6 MeV in 7.4%, 9 MeV in 52.2%, 12 MeV in 35.8%, 15 MeV in 3.7% and 18 MeV in 0.7%. The dedicated linear accelerators have electron beam energy ranging up to 9 MeV. Thus, 40.29% of these patients probably would not be treated adequately in dedicated equipment due to the need for higher values of electron energy. All patients underwent portal-film and in 72.4% the alignment between the shielding disc and the collimator was enough. However, in 27.6% of patients it had to be repositioned. No case of infection was observed during perihospitalar time. CONCLUSIONS: Intraoperative electrontherapy using conventional linear accelerator has shown low complications and worsening aesthetics rates, and oncologic efficacy Aceleradores lineares Eficácia Elétrons/uso terapêutico Estética Neoplasias da mama Período intraoperatório Radioterapia adjuvante Toxicidade Aesthetics Breast neoplasms Efficacy Electrons/therapeutic use Intraoperative period Linear accelerators Radiotherapy adjuvant Toxicity
548	Modèles physiques et perception, contributions à l'analyse du milieu sonore urbain / Physical models and perception, contributions to sound analysis in urban environment Keita, Eloi Bandia 02 July 2015 (has links) L’intégration du monde physique et des systèmes d’information est l’un des faits majeurs de la récente décennie. Cette intégration est rendue possible par les systèmes de communication, en particulier les systèmes sans fil, et par les recherches à l’interface physique dans le domaine des capteurs.L’usage de cette interface peut se concevoir de manière locale, par exemple le contrôle d’un objet, ou une aide dirigée vers une personne. Cette interface peut aussi exister au niveau distribué, en permettant la synthèse d’informations éparses et des prises de décisions concernant par exemple des économies de ressources : éteindre l’éclairage d’une rue, guider vers une place de parking libre.Les réseaux de capteurs sans fil contribuent à cette seconde catégorie et cette thèse s’est consacrée à la simulation de la propagation d’informations sonores en milieu urbain, avec une caractérisation distribuée.Le support décisif pour cette simulation est la représentation cellulaire de la ville et de ses zones : rues, jardins, rocades, bâtiments, rivières. Cette représentation cellulaire est produite par l’analyse d’imagesgéo-localisées et peut être complétée par la consultation de bases de données, pour l’élévation, par exemple. La représentation cellulaire est ensuite transformée en systèmes de processus interconnectés, à même de reproduire quantité de comportements collectifs, physiques ou numériques. / Physical world and information systems unification is a major achievement during this last decade. Communication systems, especially wireless technology, and research in physical sensors field have taken a major part in this integration.The interface between the physical word and a computer can be used in two ways. First, from a local perspective, where such a system can control for instance a single object or provide a personal assistance.Moreover, in a distributed system, this interface collects and analyses sparse data to make decisions, for instance about resource savings: to turn off streetlights, to guide to a parking spot.Wireless sensor networks are part of this second category. Thus, this thesis is focused on sound propagation simulation in urban environment, in a distributed manner.The key point of this work is a cellular representation of the city in order to model streets, gardens, ring roads, buildings, and rivers. Georeferenced image analysis, complemented by database consultation, for example to retrieve elevation data, generates this cellular model. Then, this model is converted into a system made of interconnected processes, that can reproduce many collective behaviors, whether physical or digital.We have developed a cellular automata that models sound propagation, including reflection and refraction, working on a graphics accelerator. Finally, we have produced a coupling method between observation systems by sensor networks and physical systems. Réseau de capteurs sans fil Automate cellulaire Simulation de la propagation sonore Accélérateur graphique Wireless sensor networks Cellular automata Sound propagation simulation Graphics accelerators
549	Performance-cost trade-offs in heterogeneous clouds / Compromis performance-coût dans les clouds hétérogènes Iordache, Ancuta 09 September 2016 (has links) Les infrastructures de cloud fournissent une grande variété de ressources de calcul à la demande avec différents compromis coût-performance. Cela donne aux utilisateurs des nombreuses opportunités pour exécuter leurs applications ayant des besoins complexes en ressources, à partir d’un grand nombre de serveurs avec des interconnexions à faible latence jusqu’à des dispositifs spécialisés comme des GPUs et des FPGAs. Les besoins des utilisateurs concernant l’exécution de leurs applications peuvent varier entre une exécution la plus rapide possible, la plus chère ou un compromis entre les deux. Cependant, le choix du nombre et du type des ressources à utiliser pour obtenir le compromis coût-performance que les utilisateurs exigent constitue un défi majeur. Cette thèse propose trois contributions avec l’objectif de fournir des bons compromis coût-performance pour l’exécution des applications sur des plates-formes hétérogènes. Elles suivent deux directions : un bon usage des ressources et un bon choix des ressources. Nous proposons comme première contribution une méthode de partage pour des accélérateurs de type FPGA dans l’objectif de maximiser leur utilisation. Dans une seconde contribution, nous proposons des méthodes de profilage pour la modélisation de la demande en ressources des applications. Enfin, nous démontrons comment ces technologies peuvent être intégrées dans une plate-forme de cloud hétérogène. / Cloud infrastructures provide on-demand access to a large variety of computing devices with different performance and cost. This creates many opportunities for cloud users to run applications having complex resource requirements, starting from large numbers of servers with low-latency interconnects, to specialized devices such as GPUs and FPGAs. User expectations regarding the execution of applications may vary between the fastest possible execution, the cheapest execution or any trade-off between the two extremes. However, enabling cloud users to easily make performance-cost trade-offs is not a trivial exercise and choosing the right amount and type of resources to run applications accordingto user expectations is very difficult. This thesis proposes three contributions to enable performance-cost trade-offs for application execution in heterogeneous clouds by following two directions: make good use of resources and make good choice of resources. We propose as a first contribution a method to share FPGA-based accelerators in cloud infrastructures having the objective to improve their utilization. As a second contribution we propose profiling methods to automate the selection of heterogeneous resources for executing applications under user objectives. Finally, we demonstrate how these technologies can be implemented and exploited in heterogeneous cloud platforms. Informatique en nuage Calcul distribué Ressources hétérogènes FPGA Accélérateurs Profilage Application batch Cloud computing Distributed computing Heterogeneous resources FPGA Accelerators Performance profiling Batch application
550	Performance Characterization and Optimization of In-Memory Data Analytics on a Scale-up Server Awan, Ahsan Javed January 2017 (has links) The sheer increase in the volume of data over the last decade has triggered research in cluster computing frameworks that enable web enterprises to extract big insights from big data. While Apache Spark defines the state of the art in big data analytics platforms for (i) exploiting data-flow and in-memory computing and (ii) for exhibiting superior scale-out performance on the commodity machines, little effort has been devoted to understanding the performance of in-memory data analytics with Spark on modern scale-up servers. This thesis characterizes the performance of in-memory data analytics with Spark on scale-up servers.Through empirical evaluation of representative benchmark workloads on a dual socket server, we have found that in-memory data analytics with Spark exhibit poor multi-core scalability beyond 12 cores due to thread level load imbalance and work-time inflation (the additional CPU time spent by threads in a multi-threaded computation beyond the CPU time required to perform the same work in a sequential computation). We have also found that workloads are bound by the latency of frequent data accesses to the memory. By enlarging input data size, application performance degrades significantly due to the substantial increase in wait time during I/O operations and garbage collection, despite 10% better instruction retirement rate (due to lower L1cache misses and higher core utilization).For data accesses, we have found that simultaneous multi-threading is effective in hiding the data latencies. We have also observed that (i) data locality on NUMA nodes can improve the performance by 10% on average,(ii) disabling next-line L1-D prefetchers can reduce the execution time by upto14%. For garbage collection impact, we match memory behavior with the garbage collector to improve the performance of applications between 1.6xto 3x and recommend using multiple small Spark executors that can provide up to 36% reduction in execution time over single large executor. Based on the characteristics of workloads, the thesis envisions near-memory and near storage hardware acceleration to improve the single-node performance of scale-out frameworks like Apache Spark. Using modeling techniques, it estimates the speed-up of 4x for Apache Spark on scale-up servers augmented with near-data accelerators. / <p>QC 20171121</p> Workload Characterization Big Data Analytics Multicore Performance Apache Spark Near Data Processing NUMA Hyperthreading Prefetchers Coherently attached accelerators Computer Systems Datorsystem

Search results