Spelling suggestions: "subject:"[een] DOCUMENT"" "subject:"[enn] DOCUMENT""
641 |
Transformation de documents structurés, une combinaison des approches explicite et automatiqueBonhomme, Stéphane 21 December 1998 (has links) (PDF)
Les travaux présentés dans cette thèse ont pour thème la transformation des documents structurés. Un document structuré est une collection d'éléments typés organisée par un ensemble de relations logiques définissant une structure hiérarchique. Ces relations sont définies par des grammaires hors-contexte qui décrivent des classes de documents. L'utilisation des documents structurés permet d'automatiser une partie des traitements effectués sur les documents et contribue également à améliorer leur portabilité en proposant une syntaxe commune définie par des normes (SGML, XML). Les applications utilisant cette représentation souffrent néanmoins de limites liées aux contraintes impliquées par la structuration des documents. L'objectif de ce travail est de répondre à ces limites par des techniques de transformation. Ces techniques ont pour but de modifier la structure d'un ensemble d'éléments typés pour le conformer à d'autres types ou à une nouvelle classe de documents. Cette thèse est articulée en trois parties : 1. Une étude des applications de traitement de documents identifiant les besoins de transformation, plus particulièrement dans le domaine de l'édition interactive. 2. Une évaluation des techniques et outils existant conduisant à une classific- ation des approches (filtres, transformation explicite ou automatique). Chaque classe fait l'objet d'une étude théorique, d'une étude des systèmes disponibles et d'une expérimentation. 3. Une proposition de méthode de transformation combinant les différentes techniques pour tirer parti de leurs points forts et répondre aux limitations de chacune. Cette méthode est fondée sur un algorithme de transformation automatique paramétré à l'aide de pré-couples explicites. Ce travail a conduit au développement des systèmes de transformation aujourd'h- ui intégrés dans des logiciels du projet Opéra (Thot, Byzance) et du consortiu- m W3C (Amaya).
|
642 |
Documents structurés multimédiaRoisin, Cécile 22 September 1999 (has links) (PDF)
Ce mémoire décrit les activités de recherche que j'ai menées depuis ma thèse et plus particulièrement celles que j'effectue dans le projet Opéra (outils pour les documents électroniques : recherche et applications) de l'INRIA sur les documents structurés multimédia. Ce document tente d'inscrire les différents travaux réalisés dans un cadre plus large qui comprend d'une part la modélisation des documents et d'autre part les applications de traitement de documents. Les principales contributions sont les suivantes : - Représentation abstraite des types de documents de façon à permettre de transformer les structures de documents. - Représentation de la structure logique et de la structure spatiale, ou comment intégrer des structures spatiales et logiques de façon à formater les documents structurés selon des modèles de pages complexes. - Représentation de l'information temporelle des documents multimédia qui s'intègre aux représentations logiques et spatiales et qui soit adaptée à la construction d'environnements d'édition.
|
643 |
Valorisation d'un patrimoine documentaire industriel et évolution vers un système de gestion des connaissances orienté métiersDjambian, Caroline 14 April 2010 (has links) (PDF)
Le patrimoine documentaire des entreprises s'est souvent accumulé sans que ces dernières puissent s'adapter au rythme des évolutions des technologies de l'information. La mémoire collective qui ne cesse d'être produite voit sa masse croître et est devenue éparse et hétérogène. Comme nombre d'entreprises, des problématiques transverses imposent aujourd'hui à la Division Ingénierie Nucléaire (DIN) d'EDF d'être capable de mobiliser ses connaissances de façon opérationnelle. Mais la valorisation de son patrimoine informationnel dépasse largement les aspects techniques pour prendre en compte l'organisation dans sa globalité. Ce sont en effet les métiers cœurs de l'entreprise qui sont le point de départ de notre réflexion. Dans ce contexte d'ingénierie c'est par la documentation que les connaissances techniques transitent et sont exprimées par des concepts propres aux métiers. La terminologie métiers est la clé permettant de valoriser les connaissances et de mieux gérer le patrimoine de la DIN. Elle nous permet d'aller vers une représentation explicite, au sein d'une base de connaissances centrée sur le " sens métier " de l'organisation. Notre approche résolument empirique et qualitative aboutit à une méthode de construction d'une base de connaissances métiers appliquée à un domaine délimité de la Division Ingénierie Nucléaire d'EDF.
|
644 |
Programmation Web TypéeCanou, Benjamin 04 October 2011 (has links) (PDF)
Le but de cet thèse est de contribuer à rendre la programmation Web plus flexible et plus sûre qu'elle ne l'est avec les solutions répandues actuellement. Pour ceci, nous proposons une solution dans la lignée de la famille de langages ML, qui laisse un maximum de liberté au programmeur de part son côté multi-paradigmes, tout en offrant un degré de sûreté important grâce au typage statique. Dans une première partie, nous montrons qu'il est possible de programmer le navigateur sans se plier au style de JavaScript. Notre solution est OBrowser, une implantation en JavaScript de la machine virtuelle OCaml. L'implantation prend en charge l'ensemble du langage OCaml et de sa bibliothèque, y compris le modèle de concurrence préemptif. Nous présentons de plus un mécanisme d'inter-opérabilité entre les couches objet de JavaScript et d'OCaml, permettant d'utiliser de façon bien typée l'environnement du navigateur avec les objets d'OCaml. Dans une seconde partie, nous fournissons une API de manipulation du document plus sûre et de plus haut niveau que le DOM des navigateurs. En particulier, nous cherchons à éliminer les déplacements implicites effectués par le DOM pour maintenir la forme d'arbre, qui limitent les possibilités de typage statique. Nous donnons d'abord fDOM, un modèle formel minimal similaire au DOM. Puis nous proposons cDOM, un modèle alternatif ou les déplacements sont remplacés par des copies. Nous décrivons ensuite FidoML, un langage basé sur ML, permettant les manipulations bien typées du document grâce à l'utilisation de cDOM. Dans toute cette partie, nous faisons attention à ce que les solutions données soient aussi adaptables que possible. Dans une troisième partie, nous montrons comment les travaux, jusqu'ici principalement pré- sentés dans le cadre du navigateur, s'appliquent à un contexte multi-tiers. Nous donnons d'abord un tour d'horizon des plates-formes multi-tiers proches issues de la recherche. Nous décrivons en particulier les solutions qu'elles apportent à un ensemble de problématiques spécifiques à la pro- grammation Web. Puis nous concluons en présentant les grandes lignes d'un langage multi-tiers mettant à profit les travaux des deux premières parties dans les solutions à ces différentes problé- matiques.
|
645 |
Du scripturaire à l'indiciel : texte, photographie, documentMerzeau, Louise 15 January 1993 (has links) (PDF)
C'est avec l'apparition de la photographie que coïncident les premières fractures d'un ordre symbolique où se joue l'autorité médiologique du texte. Matrice et symptôme d'un paradigme indiciel qui modifie notre expérience de la présence, de la mémoire et de l'altérité, la photographie inaugure une nouvelle économie des traces, qui ne s'est pas seulement déployée en marge du scripturaire, mais aussi de l'intérieur.
|
646 |
Behörighetskrav inför gymnasial yrkesutbildning - vem innesluts och vem utesluts? / Admittance Criteria to Upper Secondary Vocational Schools - who is to be included and who is to be excluded?Lundberg, Kjell January 2008 (has links)
<p>Behörighetskrav inför</p><p>gymnasial yrkesutbildning -</p><p>vem innesluts och vem utesluts?</p><p>Kjell Lundberg</p><p>Sammanfattning</p><p>Bakgrunden till mitt valda ämne är att jag arbetar på ett fordonstekniskt PRIV program. Elever</p><p>som går detta program har inte blivit antagna till ett nationellt program på grund av behörighetskraven</p><p>i Lpf-94. Flera av dessa elever skulle klara karaktärsämnena på ett nationellt program,</p><p>men skulle ha stora svårigheter i kärnämnena, även med extra hjälp.</p><p>De läroplansutredningar och behörighetskrav som jag har studerat är för: 1955 års yrkesskolreform,</p><p>Lgy-70, Lpf-94 och SOU 2008:27 Framtidsvägen – en reformerad gymnasieskola (förslag</p><p>till gymnasiereform GY-10).</p><p>Syftet med studien:</p><p>• Hur ser behörighetskraven till yrkesutbildning ut i de olika läroplanerna?</p><p>• Vad är tankarna bakom läroplanerna?</p><p>• Hur kan kraven i utredningarna till läroplanerna ses i ljuset av perspektiv på kunskap?</p><p>Metoden jag har använt mig av är en dokumentstudie och kunskapsbegreppet används som</p><p>teoretiskt perspektiv.</p><p>Studien börjar med en historisk utblick på yrkesutbildningar. Den fortsätter sedan med en</p><p>förklaring av syftet med läroplaner och framarbetningsstrategier av läroplaner.</p><p>Resultaten av min studie är: Med 1955 års yrkesskolreform flyttades yrkesutbildningen in i</p><p>skolmiljö. De två huvudargumenten till detta var att statsmakten ville göra det möjligt att fostra</p><p>ungdomar till demokratiska medborgare och man såg inte hur arbetsmarknaden skulle hinna</p><p>med att utbilda lärlingar.</p><p>Lgy-70 har de generösaste antagningsvillkoren. I denna läroplan blev nästan alla ungdomar</p><p>antagna till yrkesutbildning förutom att det fanns chans att bli antagen under fri kvot. Den fria</p><p>kvoten öppnade dörren för bl.a. ungdomar med utländskt utbildning och sökande som på grund</p><p>av handikapp inte kunnat uppnå full behörighet.</p><p>Lpf-94 är unik på det sättet, att det var första gången kärnämnesbetyg från grundskolan användes</p><p>som behörighetskrav till yrkeslinjerna. Samtliga program blev treåriga och gemensamma</p><p>kärnämnen infördes.</p><p>Gymnasieutredningen SOU 2008:27 (GY-10) föreslår en tydlig skärpning av behörighetskraven</p><p>för yrkesprogrammen. Utredaren föreslår minst godkänt i åtta kärnämnen, i jämförelse</p><p>med dagens tre. Nu är cirkeln sluten vad gäller yrkeskunskaperna. Utredaren föreslår vidare en</p><p>yrkesexamen, som ger en erkänd kompetens i yrket och med en komplimenterande lärlingsutbildning</p><p>till yrkesprogrammen. Nu hoppas utredarna att arbetsmarknaden skall ha kapacitet att</p><p>utbilda lärlingar, som man inte var övertygad om arbetsmarknaden hade på 50-talet.</p><p>Vidare resultat av min studie ger vid handen följande: Det källmaterial till läroplanerna jag</p><p>har analyserat har använt i stort sett samma argument till att ändra läroplanerna. Näringslivet</p><p>vill ha förändring t.ex. bättre yrkeskunskaper och statsmakten vill försäkra sig om en bred medborgarfostran</p><p>tillsammans med en möjlighet för individen att senare i livet genomgå kompetensutveckling</p><p>och högskolestudier.</p><p>Abstract</p><p>The decision to select this particular content of my thesis was due to my present occupation as a</p><p>teacher attached to a vehicle mechanics “PRIV” programme (reduced national program). Students</p><p>who participate in this programme have been excluded from the national programme due</p><p>to the criteria of admittance in Lpf-94. Several of these students would pass the trade subjects at</p><p>the national programme, but encounter difficulties with the basic subjects, in spite of added</p><p>support.</p><p>I have scrutinized the following curriculum proposals and admittance rules for: 1955 Trade</p><p>School Reform, Lgy-70, Lpf-94 and SOU 2008:27 Framtidsvägen – en reformerad gymnasieskola</p><p>(the current proposal to a new Upper Secondary School Reform, GY-10). The hypothesis</p><p>of my study is to find answers to the following questions:</p><p>• What rules of admittance applies to Vocational Schools in the different Curriculums?</p><p>• What is the basic content of thoughts behind the different Curriculums?</p><p>• How do the demands for in the proposals of the curriculums meet the conceptions of</p><p>knowledge in perspective?</p><p>The method used is a literature study and conception of knowledge is used as the theoretical</p><p>perspective.</p><p>The literature study commences with a historical retrospection of vocational training. From</p><p>there it elaborates on the purpose of curriculums and the design strategies of same.</p><p>The conclusion of my thesis is: The 1955 Reform of the trade school established the vocational</p><p>training within the existing educational training system, due to the desire from the government</p><p>to avail the possibilities in bringing up young people as responsible and democraticly</p><p>aware citizens. There was also a fear that the market did not have the capacity to train enough</p><p>trainees.</p><p>Lgy-70 has got the most generous admittance conditions. The authorities at that time realised</p><p>the importance of that education above elementary school level was availed to everybody. Even</p><p>in the case of not being born in Sweden or being a handicapped student.</p><p>Lpf-94 is unique in the following way: It introduced restrictions to enrol to the Upper Secondary</p><p>School (vocational school). All programmes became three years and all students studied</p><p>the same basic subjects.</p><p>The proposal which forms GY-10 reinforces the trend of restrictions to enrol to the Upper</p><p>Secondary School. At the same time this proposal is back to the 1955 Trade School ambition of</p><p>acquiring final trade skill. An apprenticeship as a complement to the in-house training is proposed</p><p>and further, now, the researchers are hopeful that the market shall have the capacity to</p><p>train trainees, contrary to what the researchers believed in the fifties.</p><p>Finally, all the proposals to curriculums have used the same argument to the content of the</p><p>curriculums. The business environment demands a change and the authorities will ensure a</p><p>broad civil obedience, together with a possibility for the citizen to study at the next level.</p>
|
647 |
Interactive HTMLHackborn, Dianne 13 January 1997 (has links)
As the World Wide Web continues to grow, people clearly want to do much more
with it than just publish static pages of text and graphics. While such increased interactivity
has traditionally been accomplished through the use of server-side CGI scripts,
much recent research on Web browsers has been on extending their capabilities through
the addition of various types of client-side services. The most popular of these extensions
take the form of plug-ins, applets, and "document scripts" such as Java Script. However,
because these extensions have been created in a haphazard way by a variety of independent
groups, they suffer greatly in terms of flexibility, uniformity, and interoperability. Interactive
HTML is a system that addresses these problems by combining plug-ins, applets,
and document scripts into one uniform and cohesive architecture. It is implemented as an
external C library that can be used by a browser programmer to add client-side services to
the browser. The IHTML services are implemented as dynamically loaded "language modules,"
allowing new plug-ins and language interpreters to be added to an iHTML browser
without recompiling the browser itself. The system is currently integrated with NCSA's
X Mosaic browser and includes language modules for a text viewer plug-in and Python
language interpreter. This thesis examines the iHTML architecture in the context of the
historical development of Web client-side services and presents an example of iHTML's
use to collect usage information about Web documents. / Graduation date: 1997
|
648 |
Fouille de textes : des méthodes symboliques pour la construction d'ontologies et l'annotation sémantique guidée par les connaissancesToussaint, Yannick 21 November 2011 (has links) (PDF)
Il n'existe pas d'outils clé en main pour extraire des connaissances de textes et le passage de la langue naturelle à des connaissances est très fortement contextualisé et dépendant de la tâche que l'on s'est fixée. Nous montrons que le défi d'extraction de connaissances à partir de textes reste aujourd'hui très vaste, avec de très nombreuses pistes de recherche que ce soit en lien avec des approche de type recherche d'information, traitement automatique des langues, fouille de données ou représentation des connaissances. Chacun de ces domaines de recherche recensent de nombreux sous-domaines tous très actifs. Le projet de recherche que je souhaite développer peut être vu comme un chemin au travers de ces domaines qui vise à créer un continuum (sémantique) entre les différentes étapes de la fouille de textes. L'extraction de connaissances à partir de textes est avant tout une construction de connaissances et suppose une cohérence méthodologique entre les différentes étapes de la fouille de textes. J'ai fait le choix d'ancrer mes travaux dans le domaine du formel en visant notamment une représentation des connaissances en logique, plus particulièrement en logique de descriptions. Malgré les restrictions liées à ce choix, notamment en ce qui concerne l'interaction avec des humains experts d'un domaine, la mise à jour, ou la correction d'une ontologie, une représentation formelle reste à mon sens la solution pour raisonner sur les textes et assurer la cohérence d'une ontologie. Si le but final d'un processus de fouille est de construire une représentation formelle qui puisse être le support de raisonnements, je me suis concentré dans ce projet de recherche sur la construction des connaissances en exploitant des méthodes à base de motifs, d'extraction de règles d'association ou de l'analyse formelle de concepts. L'intérêt de ces approches est qu'elles assureront un lien constant entre les textes et les connaissances. La modification des textes engendre une modification des connaissances et inversement la modification des connaissances (les ressources externes par exemple) modifient l'annotation des textes et l'ontologie. Des environnements coopératifs pourraient à terme intégrer nos travaux et faciliter ainsi la synergie entre les processus humains et les processus automatiques.
|
649 |
Metaistorija Bulata Okudžavy : Obraz dokumenta v romane Putešestvie diletantovOuvarova, Svetlana January 2009 (has links)
This study examines Okudzhava’s depiction of the process of documentalization of the past as a defining feature of the novel Puteshestvie diletantov, giving reason to consider it a form of metahistory, or an artistic statement on the subject of historical knowledge. The image of the document plays a central role in the novel Puteshestvie diletantov. Through it, Okudzhava depicts the process of knowing and (re)creating the past, as well as the process of its deformation, supplementation and modification. In the form of a document, the past finds existence in time and space, finds its author and addressee, and becomes submerged in a constantly changing context. Okudzhava does not contest the truth of the past, but rather problematizes it, immersing the reader in its real element – the narrative one, permeated by the creative will of the individual. Within this element, two juxtaposed narrative streams stand out clearly: the fictional and the documentary, each shaping the picture of the past in different ways. By thematicizing the issue of documents as evidence, Okudzhava at the same time thematicizes the influence of narrativity on the process of our recreation of past events, as well as on the course of these same events. The act of compiling a document and the act of narration appear in the novel as the driving force of the action and are treated by the author of Puteshestvie diletantov as a fully fledged manifestation of human will in History. In this way, the metafictionality of the novel (its thematicization and problematization of various narrative forms) becomes the key to its metahistoricality (the thematicization and problematization of knowledge of the past, the composition of History), inasmuch as History itself is represented here in the form of a narrative stream.
|
650 |
Probabilistic Simhash MatchingSood, Sadhan 2011 August 1900 (has links)
Finding near-duplicate documents is an interesting problem but the existing methods are not suitable for large scale datasets and memory constrained systems. In this work, we developed approaches that tackle the problem of finding near-duplicates while improving query performance and using less memory. We then carried out an evaluation of our method on a dataset of 70M web documents, and showed that our method works really well. The results indicated that our method could achieve a reduction in space by a factor of 5 while improving the query time by a factor of 4 with a recall of 0.95 for finding all near-duplicates when the dataset is in memory. With the same recall and same reduction in space, we could achieve an improvement in query-time by a factor of 4.5 while finding first the near-duplicate for an in memory dataset. When the dataset was stored on a disk, we could achieve an improvement in performance by 7 times for finding all near-duplicates and by 14 times when finding the first near-duplicate.
|
Page generated in 0.0311 seconds