Spelling suggestions: "subject:"extracción"" "subject:"l'extracció""
1 |
Un model pel tractament de la informació temporal en un sistema de comprensió automàtica de notíciesCastell Ariño, Núria 23 November 1989 (has links)
El trabajo realizado consiste en estudiar un conjunto de problemas relacionados con el tratamiento del lenguaje escrito (textos narrativos). se ha tomado, como punto central de la investigación, la información temporal:Como se expresa en el texto, como se interpreta, como ayuda al proceso de comprensión del texto y como se representa en un sistema de conocimiento.Se ha diseñado un prototipo (COTEM), basado en la investigación realizada. Escogiendo las noticias de periódico como muestra de textos narrativos.Utilizando un formalismo basado en francés, se ha implementado una base de conocimiento en la que se representan los elementos del dominio, el conocimiento lingüístico y el conocimiento general, con la inclusión de un modelo del tiempo. las instancias de elementos temporales y las relaciones entre ellas se crean y mantienen aparte en el sistema temporal.La expresión lingüística del tiempo se ha estudiado a dos niveles. a nivel de frase, proponemos una clasificación de las expresiones temporales, los patrones E-R-S para los tiempos verbales en castellano y la combinación de las expresiones temporales con los patrones verbales. a nivel de discurso, las noticias son clasificadas según su estructura narrativa y hemos definido relaciones entre estos tipos estructurales, los lexemas verbales y los tiempos verbales.El sistema temporal diseñado es independiente del dominio y consta de una red de elementos temporales de diferentes tipos (punto, intervalo cadena) conectada con un calendario. Aporta la novedad, entre otras, de distinguir entre elementos temporales cerrados y abiertos según si tienen o no, respectivamente, relación con elementos de calendario. Ello permite que el algoritmo de propagación de relaciones temporales sea más eficiente.El prototipo implementado trata las noticias a partir de una representación semántica del texto. Las noticias son interpretadas y su información es incorporada a todo el sistema.
|
2 |
Relacions conceptuals i terminologia: anàlisi i proposta de detecció semiautomàticaFeliu, Judit 02 April 2004 (has links)
Material addicional: http://hdl.handle.net/10230/6323 / Aquesta tesi doctoral té com a objectiu principal establir les bases per a un sistema de detecció semiautomàtica de relacions conceptuals a partir de textos especialitzats. Per arribar a aquest objectiu, la tesi presenta una definició de relació conceptual en el marc d'un enfocament comunicatiu de la terminologia i, a partir d'aquesta definició, l'autora detecta i aplica diversos marcadors lingüístics verbals per aïllar fragments textuals que continguin unitats de coneixement especialitzat, vehiculades mitjançant termes i relacions conceptuals. D'aquesta manera es pretén recuperar fragments de coneixement especialitzat a partir dels nusos de coneixement i de les seves relacions en textos de l'àmbit del genoma humà.Una de les aportacions principals d'aquesta tesi és l'aplicació d'una tipologia de relacions conceptuals validada empíricament a partir de textos especialitzats a la creació i alimentació d'una ontologia sobre el genoma humà. I orientat a complir l'objectiu general d'aquest treball, la detecció semiautomàtica de relacions conceptuals, l'autora proposa estratègies sintàctiques i semàntiques que permetin refinar al màxim aquests elements clau en l'organització de la informació especialitzada, combinant aquestes estratègies amb un detector i un extractor de terminologia. / The main goal of this Ph. dissertation is to establish the ground basis for a semiautomatic conceptual relations detector on the basis of specialised texts. In order to attain this goal, the Ph. dissertation includes a new definition of conceptual relations in a communicative approach to terminology. From this definition, the author detects and applies different linguistic verbal markers to isolate textual fragments containing specialised knowledge units expressed by terms and conceptual relations. The aim is to retrieve specialised knowledge fragments from knowledge nodes and the relations they establish among them in the human genome domain.One of the main contributions of this work is the application of a typology of conceptual relations empirically validated on the basis of specialised texts on the construction and updating of an ontology about the human genome domain. As for the general goal, the semiautomatic detection of conceptual relations, the author proposes syntactic and semantic strategies for the maximum refinement of the detection of these key elements in the specialised information organisation, together with the use of a term detector and extractor.Podeu consultar material addicional a http://repositori.upf.edu/handle/10230/6323
|
3 |
Contribution to the development of hydrometallurgical separation and concentration techniques focused on precious metals recoveryRovira, Miquel (Rovira Boixaderas) 02 March 1998 (has links)
Aquesta Tesi Doctoral es centra en la recuperació de metalls precisos presents en dissolucions d'àcid clorhñidric, per mitjà de tècnqiues tant emergents com ben establertes basades en els principis de la tecnologia d'extracció líquid-líquid. La importància d'aquesta temàtica radica en el gran valor i l'escassetat d'aquests metalls. Les principals conclusions extretes d'aquest treball són:- L'extracció liquid-liquid permet una ràpida extracció i stripping de Pd(II) quan s'empra l'extractant DEHTPA dissolt en querosè. El Pd(II) es pot extreure selectivament en presènica d'altres metalls com ara Cu(II), Fe(III), Pt(IV), Rh(III) i Zn(II). - DEHTPA i Alamine 336 són extractants que han estat emprats en la preparació de resines impregnades que permeten extreure selectivament el Pd(II) així com la co-extracció de Pd(II) i Pt(IV) en presència de Rh(III). Les resines impregnates presenten les avantatges de la tecnologia de bescanvi iònic i mantenen la selectivitat dels extractants. Tot i això, s'ha vist que els processos tant d'extracció com d'stripping presenten cinètiques més lentes en relació amb d'altres tecnologies.. Les resines impregnades també s'han combinat amb la tecnologia de llit fluiditzat permetent el treball en continu.- Les membranes líquides suportades (MLS) presenten l'atractiu que combinen els processos d'ectracció i stripping en una sola fase. El sistema SLM/DEHTPA permet el transport selectiu de Pd(II), que es troba controlat per fenòmens de difusió. La presència d'impureses en la solució d'alimentació és important donat que pot provocar fenòmens d'obturació en la membrana. - L'extracció selectiva cloud point (CP) d'Au(III) emprant el surfactant PONPE7.5 s'ha aconseguit a temperatura ambient de forma similar a l'extracció líquid-líquid amb l'avantatge que no es requereix la utilització de dissolvents orgànics. L'aplicació d'aquesta tècnica es va aplicar amjb èxit a la recuperació d'Au provinent de circuits impresos, si bé cal esmentar que en l'etapa d'stripping va ésser necessària la utilització de cloroform. / This thesis is focused on the recovery of precious metals from hydrochloric acid solutions through emergent or well established metal recovery techniques based or on the principles of solvent extraction technology. This subject is of a great importance due to the high value and scarcity of precious metals, consequently the need of developing and consolidating new separation and concentration processes is imperative. The main conclusions derived from this work are:- Liquid-liquid extraction allow fast Pd(II) extraction and stripping when the extractant DEHTPA dissolved in kerosene is used as organic phase. Pd(II) can be selectively extracted by DEHTPA over Cu(II), Fe(III), Pt(IV), Rh(III) and Zn(II). - DEHTPA and Alamine 336 are appropiate extractants for preparation of impregnated resins suitable for selective extraction of Pd(II) over metal impurities and co-extraction of Pd(II) and Pt(IV) against Rh(III). Impregnated resins maintain the advantages of ion-exchange technology, and also keep the selective characteristics of the extractants. However, the extraction and stripping kinetics of impregnated resins are slow compared to solvent extraction. Impregnated resins have also benn combined with fluidized bed technology allowing continuous operation.- Supported liquid membranes (SLM) are very attractive since they combine the processes of extraction and stripping in a single stage. SLM/DEHTPA system permits selective Pd(II) transport on a diffusion controlled process. The presence of impurities inn the feed solution may cause blockage of the membrane.- Selective cloud point (CP) extraction of Au(III) using the surfactant PONPE7.5 is achieved at ambient temperature in a similar manner as in solvent extraction not requiring the use of organic solvents. The application of CP extraction is demonstrated for the recovery of Au from a printed substrate, although the usage of an organic solvent, chloroform, is necessary in the stripping step.
|
4 |
Estudi dels marcadors de conques altament reductoresCabrera Ortega, Miquel 21 August 1999 (has links)
El treball descrit en aquesta tesi té com a objectiu l'estudi de la matèria orgànica soluble de conques geològiques reductores amb un elevat contingut en sofre. Els estudis previs de geoquímica orgànica endegats en conques reductores posen de manifest que els biomarcadors sofrats són de gran importància per a la descripció dels paleoambients, donat que reflecteixen els biocompostos funcionalitzats, que, d'altra forma s'haurien alterat. Per aquest estudi s'han seleccionat quatre conques sedimentàries que destaquen de forma significativa per la seva anoxicitat, així com, per haver experimentat una important sulfato- reducció. Les conques escollides són: Orce, Ribesalbes, Mequinensa i Organyà.La conca d'Orce és d'origen lacustre i de tipus endorreica, data del Plio-Plistocè (1-5 milions d'anys) i es localitza al nord de la província de Granada. El seu interès rau en el descobriment d'importants jaciments paleontològics amb restes antropogèniques.La conca de Ribesalbes també és lacustre i endorreica, pertany al Miocè mitjà (Serraval·là, de 12 a 13 milions d'anys) i es situa a l'oest de la província de Castelló. A principis d'aquest segle s'hi van explotar les pissarres bituminoses mitjançant tècniques de piròlisi.La conca de Mequinensa igualment és d'origen lacustre i de caràcter endorreica, pertany a l'Oligocè superior (Catià, al voltant dels 30 milions d'anys) i es localitza al sud del Sistema dels Monegros, a la província de Lleida. La importància d'aquesta conca es deu a l'explotació de lignits molt rics en sofre.La conca d'Organyà és d'origen marí i data del Cretaci inferior (més de 100 milions d'anys). Es situa a la província de Lleida, a la comarca de l'Alt Urgell. Els materials que formen aquesta conca constitueixen una roca mare de petroli.Els objectius d'aquest treball són:1. L'anàlisi dels biomarcadors per a la determinació de l'origen de les aportacions de la matèria orgànica que reberen les conques estudiades, caracteritzant-ne les contribucions més significatives.2. La descripció de les condicions paleoambientals que donaren lloc a aquests dipòsits sedimentaris.3. L'avaluació de la maduresa de la matèria orgànica.La tesi comença amb una introducció on es descriu la singularitat de cada conca, es continua amb les descripcions geològiques i petrogràfiques, tot localitzant les mostres estudiades a la columna estratigràfica. Després, es mostra l'anàlisi elemental de la matèria orgànica, per prosseguir amb la descripció dels biomarcadors apolars i polars: en primer lloc es descriuen els compostos acíclics, lineals i ramificats, tot començant pels compostos hidrocarbonats, després els oxigenats i finalment els sofrats; en segon lloc, els biomarcadors cíclics, començant pels diterpenoides i continuant amb els triterpenoides, amb especial rellevància dels esteroides i els hopanoides, i finalment, els oleanoides, ursanoides i lupanoides. Cal destacar la identificació de més d'una vintena de nous biomarcadors identificats per primera vegada en aquesta tesi. La descripció de les conques finalitza amb les conclusions sobre els aports de la matèria orgànica, l'ambient deposicional i la maduresa. / The aim of this thesis is the study and characterization of the soluble organic matter in sulphur rich geological basins. The previous studies carried out on reducing sedimentary basins show the significant presence of organic geochemical biomarkers with sulphur, which are very relevant for the description of the paleo-environment conditions of the sedimentation, since they reflect the presence of biological compounds very well preserved.For this study four sedimentary basins of Spain have been selected due to their anoxicity and also for having suffered an important sulphate-reduction process. The selected basins are: Orce, Ribesalbes, Mequinensa and Organyà.The basin of Orce is of lacustrine origin, it belongs to the Plio-Pleistocene period (1 to 5 million years) and it is located to the north of the province of Granada. Its interest comes from the fact that there are important palaeontology deposits with anthropogenic rests.The basin of Ribesalbes also is also of type lacustrine and belongs to the Miocene period (Serravalià, 12 to 13 million years). It is located to the west of the province of Castellon. At the beginning of XX century the bituminises shales were extracted in order to obtain oil with techniques of pyrolisis.The basin of Mequinensa is also of lacustrine origin and belongs to the upper Oligocene period (Catià from around 30 million years) and is located to the south System of the Monegros, in the province of Lleida. The importance of this basin is due to the high sulphur content of the lignite that is formed in this place.The basin of Organyà is of marine origin and dates from the lower Cretaceous (more than 100 million years). It is located in the province of Lleida, in the region of the Alt Urgell. The materials that form this basin constitute a oil source rock.The items of this work are:1. The analysis of biomarkers for the determination of the origin of the contribution of the matter organic.2. The description of the paleoenvironmetal conditions that gave rise to these sedimentations deposits.3. The evaluation of the maturity of the organic matter.The thesis is divided into nine chapters: The study begins with a general geological description to go on with the analysis of the paleoconditions of the environmental deposition that favour the preservation of the organic matter. Subsequently, after that, there is an accurate geochemical description of each basin. The results of this work show that the Orce basin is characterized by type I querogen and, the Ribesalbes basin is of type I-S kerogen, the Organyà basin is of type II-S and the Mequinensa basin is of type III-S querogen. The study ends with the conclusions on the contributions of the organic matter, the depositional environment and the maturity. In the case of the Organyà basin only non polar fractions have been studied, due to the little presence of polar compounds, attributed to the high maturity of the organic matter. Finally, there is also a compilation of biomarkers identified for the first time in this thesis, indicating in its case if their biological precursors.
|
5 |
Unsupervised learning of relation detection patternsGonzàlez Pellicer, Edgar 01 June 2012 (has links)
L'extracció d'informació és l'àrea del processament de llenguatge natural l'objectiu de la qual és l'obtenir dades
estructurades a partir de la informació rellevant continguda en fragments textuals.
L'extracció d'informació requereix una quantitat considerable de coneixement lingüístic. La especificitat d'aquest
coneixement suposa un inconvenient de cara a la portabilitat dels sistemes, ja que un canvi d'idioma, domini o estil té un
cost en termes d'esforç humà. Durant dècades, s'han aplicat tècniques d'aprenentatge automàtic per tal de superar aquest
coll d'ampolla de portabilitat, reduint progressivament la supervisió humana involucrada. Tanmateix, a mida que augmenta
la disponibilitat de grans col·leccions de documents, esdevenen necessàries aproximacions completament nosupervisades
per tal d'explotar el coneixement que hi ha en elles.
La proposta d'aquesta tesi és la d'incorporar tècniques de clustering a l'adquisició de patrons per a extracció d'informació,
per tal de reduir encara més els elements de supervisió involucrats en el procés En particular, el treball se centra en el
problema de la detecció de relacions. L'assoliment d'aquest objectiu final ha requerit, en primer lloc, el considerar les
diferents estratègies en què aquesta combinació es podia dur a terme; en segon lloc, el desenvolupar o adaptar algorismes
de clustering adequats a les nostres necessitats; i en tercer lloc, el disseny de procediments d'adquisició de patrons que
incorporessin la informació de clustering.
Al final d'aquesta tesi, havíem estat capaços de desenvolupar i implementar una aproximació per a l'aprenentatge de
patrons per a detecció de relacions que, utilitzant tècniques de clustering i un mínim de supervisió humana, és competitiu i
fins i tot supera altres aproximacions comparables en l'estat de l'art. / Information extraction is the natural language processing area whose goal is to obtain structured data from the relevant
information contained in textual fragments.
Information extraction requires a significant amount of linguistic knowledge. The specificity of such knowledge supposes a
drawback on the portability of the systems, as a change of language, domain or style demands a costly human effort.
Machine learning techniques have been applied for decades so as to overcome this portability bottleneck¿progressively
reducing the amount of involved human supervision. However, as the availability of large document collections increases,
completely unsupervised approaches become necessary in order to mine the knowledge contained in them.
The proposal of this thesis is to incorporate clustering techniques into pattern learning for information extraction, in order to
further reduce the elements of supervision involved in the process. In particular, the work focuses on the problem of relation
detection. The achievement of this ultimate goal has required, first, considering the different strategies in which this
combination could be carried out; second, developing or adapting clustering algorithms suitable to our needs; and third,
devising pattern learning procedures which incorporated clustering information.
By the end of this thesis, we had been able to develop and implement an approach for learning of relation detection patterns
which, using clustering techniques and minimal human supervision, is competitive and even outperforms other comparable
approaches in the state of the art.
|
6 |
Detecció de compostos volàtils, clorofenols, cloroanisoles i 2,4,6-tribromoanisole, relacionats amb el "gust del suro"Insa Aguilar, Sara 22 May 2006 (has links)
D'entre els defectes organolèptics associats al vi, en destaca l'anomenat "gust de suro" habitualment vinculat a la presència de cloroanisoles, els quals són productes de l'activitat microbiana formats a partir dels corresponents clorofenols. La present tesi doctoral recull, en primer lloc, metodologies analítiques adreçades principalment a la determinació dels compostos clorofenòlics (2,4,6-triclorofenol, 2,3,4,6-tetraclorofenol i pentaclorofenol) en el control de qualitat dels taps suro, emprant dissolucions hidroalcohòliques com a medi de maceració o d'extracció i utilitzant les tècniques d'extracció en fase sòlida (SPE) i microextracció en fase sòlida (SPME) acoblades a la cromatografia de gasos (GC).En segon lloc, per tal de dur a terme l'anàlisi de cloroanisoles juntament amb els seus precursors en matrius de suro s'ha avaluat un mètode basat en l'extracció amb dissolvent orgànic, el qual ha estat aplicat per a l'estudi de diferents sistemes d'eliminació d'aquests anàlits en la matriu citada. En darrer lloc, s'han proposat metodologies per l'anàlisi de mostres de vi, en les quals d'una banda s'han determinat els compostos clorofenòlics utilitzant la SPME i de l'altra el 2,4,6-tricloroanisole i el 2,4,6-tribromoanisole mitjançant l'acoblament de la SPE i la injecció de grans volums (LVI) en el sistema cromatogràfic. / The organoleptic defect known as cork taint is associated with a musty or mouldy aroma in wine. Chloroanisoles, which are produced through a process of detoxification by fungal methylation of chlorophenolic compounds, are considered to be the main contributory substances. In the present work, analytical methods for the determination of chlorophenols (2,4,6-trichlorophenol, 2,3,4,6-tetrachloropheol and pentachlorophenol) in cork matrices using the solid-phase extraction (SPE) and the solid-phase microextraction (SPME) as preconcentration techniques were evaluated. Therefore, hydroalcoholic solutions have been proposed as extractant solvent in order to test the quality of cork stoppers.Furthermore, a methodology based on extraction with an organic solvent for the simultaneous determination of chloroanisoles and chlorophenols in cork matrices was proposed. This methodology was applied with the aim of checking the efficiency of several washing treatments to remove the target analytes in naturally contaminated cork samples.Finally, different procedures have been developed for the analysis of wine samples. On one hand, chlorophenols were quantified by employing a SPME method. On the other hand, a reliable SPE method coupled to large volume injection was proposed for the determination of both 2,4,6-trichloroanisole and 2,4,6-tribromoanisole.
|
7 |
Textos especialitzats i variació vertical: la diversitat terminològica com a factor discriminant del nivell d'especialització d'un textDomènech Bagaria, Ona 28 April 2006 (has links)
Aquesta tesi doctoral es proposa contribuir a la delimitació del nivell d'especialitat d'un text a partir de l'anàlisi quantitativa de la terminologia que conté, amb la voluntat, d'una banda, de contribuir a l'estudi i caracterització del text especialitzat des d'una perspectiva lingüística, i de l'altra, de proposar una via que permeti la determinació d'un paràmetre objectivable, vàlid per discriminar un text en funció del nivell d'especialització que presenta, amb la finalitat d'aportar les bases de futurs sistemes de detecció automàtica del nivell d'especialització d'un text.D'acord amb aquest objectiu, la tesi ofereix una revisió crítica de les diferents aproximacions lingüístiques al concepte de text especialitzat i a la consideració de la variació vertical present en les produccions especialitzades i proposa l'ús d'un mesurador estadístic de la diversitat (l'índex de Shannon-Weaver) per obtenir un paràmetre, relacionat amb la diversitat terminològica, susceptible de discriminar els textos en funció del nivell d'especialització que presenten.
|
8 |
Extracció de terminologia: elements per a la construcció d'un SEACUSE (Sistema d'Extracció Automàtica de Candidats a Unitats de Significació Especialitzada)Estopà, Rosa 26 July 1999 (has links)
L'objectiu principal d'aquesta tesi és dissenyar un model d'un Sistema d'Extracció Automàtica de Candidats a Unitats de Significació Especialitzada (SEACUSE) basat en fonaments lingüístics de diferents tipus i adequat a les necessitats d'unes activitats professionals concretes.Per fer-ho, en el primer capítol es descriu els sistemes d'extracció automàtica de candidats a terme (SEACAT) i s'analitza i valora els principals SEACAT amb l'objectiu d'elaborar un estat de la qüestió en aquest camp que evidenciï les característiques i sobretot les limitacions d'aquests sistemes.En el segon capítol, en primer lloc, es validen les hipòtesis que vam postular en el treball de recerca sobre els patrons estructurals de les UTP i en segon lloc a comprovar les principals limitacions dels SEACAT que es basen en patrons morfosintàctics. Aquestes limitacions es manifesten en dos aspectes: el silenci (unitats pertinents no detectades per l'extractor) i el soroll (unitats no pertinents presentades com si ho fossin).Les dades que es desprenen de l'anàlisi del silenci i el soroll s'estudien en el tercer i quart capítol, respectivament. Així, primer s'analitzen els tipus i les causes de silenci que produeixen els SEACAT, i tot seguit els tipus i les causes del soroll generat per aquests sistemes.El cinquè proposa elements i estratègies perquè un sistema d'extracció automàtica redueixi el silenci i el soroll, i d'aquesta manera aconsegueixi que els seus resultats s'acostin més al reconeixement i delimitació manuals de les unitats de significació especialitzada.El sisè capítol introdueix el punt de vista de l'usuari i planteja el fet que no totes les activitats professionals requereixen els mateixos tipus ni el mateix nombre d'unitats especialitzades d'un text. Aquesta hipòtesi és verificada a través d'una prova experimental basada en les necessitats de quatre activitats professionals diferents.I, finalment, en el setè capítol, s'exposa una proposta de model de SEACUSE que, a més de les estratègies plantejades en el capítol cinquè, té en compte les finalitats dels professionals a l'hora de presentar els resultats. / El objetivo principal de esta tesis es diseñar un modelo de un Sistema de Extracción Automática de Candidatos a Unidades de Significación Especializada (SEACUSE) basado en fundamentos lingüísticos diferentes y adecuado a las necesidades de unas actividades profesionales concretas.En el primer capítulo se describen los sistemas de extracción automática de candidatos a término (SEACAT) y se analizan y valoran los principales SEACAT con el objetivo de elaborar un estado de la cuestión en este campo que evidencie las características y sobre todo las limitaciones de estos sistemas.En el segundo capítulo, primeramente, se validan las hipótesis que postulamos en el proyecto de investigación previo a la tesis doctoral sobre los patrones estructurales de las UTP y después se comprueba las principales limitaciones de los SEACAT que se basan en patrones morfosintácticos. Estas limitaciones se manifestar en dos aspectos: el silencio (unidades pertinentes no detectadas por el extractor) y el ruido (unidades no pertinentes presentadas como si lo fueran).Los datos que se desprenden del análisis del silencio y del ruido se estudian en los capítulos tercero y cuarto, respectivamente. Así, primero se analizan los tipos y las causas de silencio que producen los SEACAT, y seguidamente los tipos y las causas del ruido generado por estos sistemas.El quinto propone elementos y estrategias para que un sistema de extracción automática reduzca el silencio y el ruido, y de esta manera consiga que sus resultados se aproximen más al reconocimiento y delimitación manuales de las unidades de significación especializada.El sexto capítulo introduce el punto de vista del usuario y plantea el hecho de que no todas las actividades profesionales requieren los mismos tipos ni el mismo número de unidades especializadas de un texto. Esta hipótesis se verifica a través de una prueba experimental basada en las necesidades de cuatro actividades profesionales diferentes.Y, finalmente, en el último capítulo, se expone una propuesta de un modelo de SEACUSE que, además de las estrategias planteadas en el quinto capítulo, tiene en cuenta las finalidades de los profesionales en la presentación de los resultados. / The main objective of this dissertation is to design a model for an Automatic Extraction System for Candidates of Specialized Meaning Units (AESCSMU) based upon different types of linguistic foundations that are adequate to meet the needs of concrete professional activities.To achieve this purpose, the first chapter describes the automatic extraction systems for term candidates (AESTCs). It also analyzes and makes an evaluation of the main AESTCs with the purpose of presenting the state of the issue in this field of knowledge, while showing the characteristics and, above all, the limitations of these systems.The second chapter validates, in the first place, the hypotheses that are going to be taken for granted during the research project about the structural patterns of the multiword units, and, in the second place, tests the main limitations of the AESTCs that are based upon morphosyntactic patterns. These limitations become manifest in two aspects: silence (when the extractor does not detect pertinent units) and noise (when non-pertinent units are presented as if they were pertinent).Data derived from the analysis of silence and noise are studied both on the third and fourth chapters. There, we first analyze the types and causes of silence produced by the AESTCs, and then the types and causes of the noise generated by these systems.The fifth chapter proposes elements and strategies so that automatic extraction systems may reduce silence as well as noise. This way we can accomplish that their results may come closer to the manual identification and delimitation of specialized meaning units.The sixth chapter introduces of the user's point of view, and states the fact that not all the professional activities require the same type and the same number of specialized units from a text. This hypothesis is verified through an experimental test based upon the needs of four different professional activities.Finally, the seventh and last chapter proposes a possible model of an AESCSMU that, besides the strategies presented on chapter five, considers the goals of professionals at the time of presenting the results.
|
Page generated in 0.0381 seconds