1 |
A Framework of Automatic Subject Term Assignment: An Indexing Conception-Based ApproachChung, EunKyung 12 1900 (has links)
The purpose of dissertation is to examine whether the understandings of subject indexing processes conducted by human indexers have a positive impact on the effectiveness of automatic subject term assignment through text categorization (TC). More specifically, human indexers' subject indexing approaches or conceptions in conjunction with semantic sources were explored in the context of a typical scientific journal article data set. Based on the premise that subject indexing approaches or conceptions with semantic sources are important for automatic subject term assignment through TC, this study proposed an indexing conception-based framework. For the purpose of this study, three hypotheses were tested: 1) the effectiveness of semantic sources, 2) the effectiveness of an indexing conception-based framework, and 3) the effectiveness of each of three indexing conception-based approaches (the content-oriented, the document-oriented, and the domain-oriented approaches). The experiments were conducted using a support vector machine implementation in WEKA (Witten, & Frank, 2000). The experiment results pointed out that cited works, source title, and title were as effective as the full text, while keyword was found more effective than the full text. In addition, the findings showed that an indexing conception-based framework was more effective than the full text. Especially, the content-oriented and the document-oriented indexing approaches were found more effective than the full text. Among three indexing conception-based approaches, the content-oriented approach and the document-oriented approach were more effective than the domain-oriented approach. In other words, in the context of a typical scientific journal article data set, the objective contents and authors' intentions were more focused that the possible users' needs. The research findings of this study support that incorporation of human indexers' indexing approaches or conception in conjunction with semantic sources has a positive impact on the effectiveness of automatic subject term assignment.
|
2 |
Avaliação do processo de indexação de assuntos em repositórios institucionais pela abordagem da recuperação da informação /Tartarotti, Roberta Cristina Dal'Evedove January 2019 (has links)
Orientador: Mariângela Spotti Lopes Fujita / Resumo: Na contemporaneidade, os repositórios institucionais possibilitam a reunião, armazenamento, tratamento, preservação e visibilidade dos recursos informacionais produzidos no âmbito acadêmico. Considerando-se que o campo da Organização do Conhecimento possui os fundamentos teórico-práticos necessários no que tange aos problemas de representação e recuperação em sistemas de recuperação da informação, a proposição da tese foi investigar/avaliar o processo de indexação de assuntos em repositórios institucionais no contexto de bibliotecas universitárias e sua influência na recuperação da informação pelos usuários, visando o aprimoramento do tratamento/da representação temática da informação documental e da recuperação por assuntos. O objetivo geral da pesquisa foi contribuir para a implementação/melhorias de diretrizes de indexação de assuntos em repositórios institucionais no contexto de bibliotecas universitárias, possibilitando a adequada representação e recuperação por assuntos nestes sistemas de recuperação da informação. Para tanto, foram delineados os seguintes objetivos específicos: a) realizar estudo teórico sobre os repositórios institucionais como sistemas de recuperação da informação e do processo de indexação de assuntos em perspectiva dicotômica: do tratamento/da representação e da recuperação por assuntos no contexto de bibliotecas universitárias; b) investigar o tratamento/a representação temática da informação documental em repositórios institucionais no contexto d... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: In present times, the institutional repositories enable the gathering, storage, treatment, preservation and visibility of information resources produced in the academic field. Considering that the Knowledge Organization field has the necessary theoretical-practical foundations regarding the issues of representation and retrieval in information retrieval systems, the proposition of the thesis was to investigate/evaluate the subject indexing process in institutional repositories in the context of academic libraries and its influence on information retrieval by users, aiming at improving the treatment/thematic representation of documentary information and subject retrieval. The general objective of the research was to contribute to the implementation / improvement of subject index guidelines in institutional repositories in the context of academic libraries, enabling the adequate representation and subject retrieval in information retrieval systems. To this end, the following specific objectives were outlined: a) conducting a theoretical study on institutional repositories as information retrieval systems and the subject index process within in a dichotomous perspective: of the treatment/of the representation and of the subject retrieval in the context of academic libraries; b) investigating the treatment/the thematic representation of documentary information in institutional repositories in the context of academic libraries, by means of the application of organizational diagnos... (Complete abstract click electronic access below) / Resumen: En los tiempos contemporáneos, los repositorios institucionales permiten la recolección, almacenamiento, tratamiento, preservación y visibilidad de los recursos informacionales producidos en el campo académico. Considerando que el campo de la Organización del Conocimiento presenta los fundamentos teórico-prácticos necesarios en cuanto a los problemas de representación y recuperación en los sistemas de recuperación de información, la propuesta de la tesis fue investigar/evaluar el proceso de indización por materias en repositorios institucionales y su influencia en la recuperación de información por los usuarios, pretendiendo el perfeccionamiento del tratamiento temático de la información documental y de la recuperación por materias en estos sistemas de recuperación tanto en el contexto de bibliotecas universitarias como en el ámbito académico. El objetivo general de la investigación fue contribuir a la implementación/mejoras de directrices de indización por materias en repositorios institucionales en el contexto de bibliotecas universitarias, posibilitando la adecuada representación y recuperación por materias en estos sistemas de recuperación de información. Para ello, fueron delineados los seguientes objetivos específicos: a) realizar un estudio teórico sobre el proceso de indización por materias desde la perspectiva de la Organización del Conocimiento en perspectiva dicotómica: del tratamiento/de la representación y de la recuperación por materias en el contexto de bibliot... (Resumen completo clicar acceso eletrônico abajo) / Doutor
|
3 |
Indexing consistency between online cataloguesChen, Xu 23 May 2008 (has links)
In der globalen Online-Umgebung stellen viele bibliographische Dienstleistungen integrierten Zugang zu unterschiedlichen internetbasierten OPACs zur Verfügung. In solch einer Umgebung erwarten Benutzer mehr Übereinstimmungen innerhalb und zwischen den Systemen zu sehen. Zweck dieser Studie ist, die Indexierungskonsistenz zwischen Systemen zu untersuchen. Währenddessen werden einige Faktoren, die die Indexierungskonsistenz beeinflussen können, untersucht. Wichtigstes Ziel dieser Studie ist, die Gründe für die Inkonsistenzen herauszufinden, damit sinnvolle Vorschläge gemacht werden können, um die Indexierungskonsistenz zu verbessern. Eine Auswahl von 3307 Monographien wurde aus zwei chinesischen bibliographischen Katalogen gewählt. Nach Hooper’s Formel war die durchschnittliche Indexierungskonsistenz für Indexterme 64,2% und für Klassennummern 61,6%. Nach Rolling’s Formel war sie für Indexterme 70,7% und für Klassennummern 63,4%. Mehrere Faktoren, die die Indexierungskonsistenz beeinflussen, wurden untersucht: (1) Indexierungsbereite; (2) Indexierungsspezifizität; (3) Länge der Monographien; (4) Kategorie der Indexierungssprache; (5) Sachgebiet der Monographien; (6) Entwicklung von Disziplinen; (7) Struktur des Thesaurus oder der Klassifikation; (8) Erscheinungsjahr. Gründe für die Inkonsistenzen wurden ebenfalls analysiert. Die Analyse ergab: (1) den Indexieren mangelt es an Fachwissen, Vertrautheit mit den Indexierungssprachen und den Indexierungsregeln, so dass viele Inkonsistenzen verursacht wurden; (2) der Mangel an vereinheitlichten oder präzisen Regeln brachte ebenfalls Inkonsistenzen hervor; (3) verzögerte Überarbeitungen der Indexierungssprachen, Mangel an terminologischer Kontrolle, zu wenige Erläuterungen und "siehe auch" Referenzen, sowie die hohe semantische Freiheit bei der Auswahl von Deskriptoren oder Klassen, verursachten Inkonsistenzen. / In the global online environment, many bibliographic services provide integrated access to different web-based OPACs. In such an environment, users expect to see more consistency within and between systems. In practice, indexers are not always consistent with each other, because subject indexing is essentially a subjective process. The purpose of this study is to investigate the indexing consistency between systems and to find out whether it is still frustrated in the new networked environment. Meanwhile, some factors which may influence indexing consistency will be examined. The most important aim of this study is to find out the reasons for inconsistencies, so that some reasonable suggestions can be made to improve indexing consistency. A sample of 3,307 monographs, i.e. 6,614 records was drawn from two Chinese bibliographic catalogues. According to Hooper¡¯s formula, the average consistency for index terms was 64.2% and for class numbers 61.6%. According to Rolling¡¯s formula, for index terms it was 70.7%, for class numbers 63.4%. Several factors affecting indexing consistency were examined: (1) exhaustivity of indexing; (2) specificity; (3) length of monographs indexed; (4) category of indexing languages; (5) subject area of monographs indexed; (6) development of disciplines; (7) structure of vocabulary; (8) year of publication. The reasons for inconsistencies were also analyzed. The analysis revealed that: (1) indexers¡¯ lack of subject knowledge, their unfamiliarity with indexing languages and indexing rules led to a lot of inconsistencies; (2) the lack of unified or detailed indexing policies brought about inconsistencies as well; (3) delayed revision of indexing languages, lack of vocabulary control, shortage of scope notes and ¡°see also¡± reference notes, and high semantic freedom by term or class choosing also caused inconsistencies.
|
4 |
Mehr finden durch schlaueres Suchen / Find more hits through smarter searches / Trouver plus, par la recherche intelligent24 January 2011 (has links) (PDF)
Vom 21.-23. Juli 2010 fand in Karlsruhe die 34. Jahrestagung der Gesellschaft für Klassifikation statt. In diesem Rahmen tagten an zwei Tagen die Bibliothekare. Es kamen über 60 Teilnehmer aus der BRD, Österreich und der Schweiz. Deren Thema seit jeher ist Inhaltserschließung oder einfacher: Das Suchen und Finden. Unser Motto diesmal: „Mehr finden durch schlaueres Suchen“. Ort der bibliothekarischen Tagung war die KIT-Bibliothek. Vorgetragen wurden 15 Beiträge aus den Bereichen Forschung, Entwicklungen (auch in den beiden Dezimalklassifikationen) sowie Erfahrungsberichte. Im Mittelpunkt stand jeweils das Neue! / The 34th Annual Meeting of the German Classification Society took place in Karlsruhe on 21-23 July 2010. Traditionally included was the meeting of the librarian section on 22-23 July. There were about 60 participants in attendance from Germany, Austria and Switzerland. Their general topic has always been “subject indexing” or more exactly “indexing and retrieval”. This year‟s motto urged: “Find more hits through smarter searches”. The meeting was hosted by the Karlsruhe KIT library. Presented were 15 contributions from the fields of research, reviews and development. Among the subjects: both decimal classifications. The main goal required as ever: It's the novelty that counts! / Le 21-23 Juillet 2010 a été lieu à Karlsruhe la 34e Réunion annuelle de la Société allemand de Classification. Dans ce cadre, les bibliothécaires se sont réunis pour deux jours, le 22-23, selon la tradition. Il y avait environ 60 participants de l'Allemagne, l'Autriche et la Suisse. Leur thème a toujours été le indexation et la recherche, ou plus simplement “Rechercher et Trouver“. Le slogan de cette année a été : ”Trouver plus, par la recherche intelligente”. Lieu de la réunion était la bibliothèque du KIT de Karlsruhe. Ils sont été presenté 15 contributions dans les domaines de la recherche, du développement (également dans les classifications decimales) et des commentaires. L‟objectif principal, comme toujours : C‟est la nouveauté qui compte !
|
5 |
Efficiency and effectiveness of deep structure based subject indexing languages : PRECIS vs. DSISBiswas, Subal C. January 1988 (has links)
A 'Subject Indexing Language' (SIL) is an artificial language used for formulating names of subjects. Although classificationists have sought for universals in many fields of study such as, philosophy, biology, general systems theory, etc., the search for a deep structure of SILs formally began with Ranganathan's idea of 'absolute syntax' and was brought to the present by G. Bhattacharyya and D. Austin. Whereas Bhattacharyya's deep structure of SIL is primarily based on classificatory principles (parallel to 'absolute syntax'), the deep structure proposed by Austin has a linguistic connotation. The present study describes and compares two such deep structurebased SILs, viz., PRECIS (PREserved Context Index System) and DSIS (Deep Structure Indexing System), a recent computerized version of POPSI (POstulate-based Permuted Subject Indexing), developed by F. J. Devadason at Documentation Research and Training Centre, Bangalore, India. Both also belong to the category of SILs typified as 'string indexing' languages. The study involves: i) writing of a suitable DSIS index entry generation program, ii) using both PRECIS (in-house) and DSIS programs to index a collection of representative sample documents from the soft sciences, iii) analyzing and comparing their respective syntactic and semantic aspects in terms of both linguistic and classificatory principles, and iv) applying some measures of efficiency and effectiveness. It was realized that certain modifications in the existing DSIS string manipulation algorithms are necessary to make the program fully operational. Although, no attempts have been made to quantify the measures of effectiveness and efficiency as such, suggestions have been provided as to what these probably would be. Some indications of their searching difficulties for a prospective searcher have been put forward as well.
|
6 |
Von Chaos und Qualität ‐ die Ergebnisse des Projekts Collaborative TaggingKrätzsch, Christine 19 January 2012 (has links) (PDF)
Im akademischen Bereich sind in Social-Software-Anwendungen wie Connotea, CiteULike und BibSonony umfangreiche Sammlungen von nutzergenerierten Metadaten entstanden. Im Vergleich zu kontrollierten Vokabularen, wie der Schlagwortnormdatei, handelt es sich dabei um personalisierte und in weiten Teilen „chaotische“ Inhaltserschließung. An der Universitätsbibliothek Mannheim wurde in einem DFG-Projekt untersucht, inwieweit das Potential dieser Art von Metadaten für eine bessere und nutzerorientierte Präsentation von Informationsressourcen eingesetzt werden kann.
Ein Kernstück der Untersuchung war die Analyse von Tag-Daten des Systems BibSonomy. Es zeigte sich, dass nicht nur die mangelnde semantische Strukturiertheit der Tags, sondern auch ihre heterogene Gestalt einen limitierenden Faktor für die Verwendung in der bibliothekarischen Sacherschließung darstellt. Der Beitrag gibt anhand von Beispielen Einblick in das qualitative und strukturelle Chaos der untersuchten Tags und fasst die Ergebnisse des Projekts zusammen.
|
7 |
Konzeption einer fachlichen Facette für einen Bibliothekskatalog am Beispiel der Universitätsbibliothek MannheimFrick, Julian 20 January 2012 (has links) (PDF)
Eine in vielen Bibliothekskatalogen bislang nicht verwirklichte Recherchefunktion ist die gezielte Suche nach Literatur aus bestimmten Fachgebieten. Recherchen mit Notationen der im Katalog verwendeten Klassifikation oder mit Schlagwörtern können den Anspruch an eine fachgebietsumfassende Suche meist nicht erfüllen. Eine mögliche Lösung ist die Entwicklung einer bibliotheksspezifischen fachlichen Facette, in der jeder Titel über seine sachlichen Erschließungsdaten einem oder mehreren Fächern zugeordnet wird.
Im Vortrag wird nach einem Überblick über bereits vorhandene fachliche Facettierungsmöglichkeiten in verschiedenen Bibliothekskatalogen die Konzeption einer fachlichen Facette für den Bibliothekskatalog der Universitätsbibliothek Mannheim erläutert. Hierbei wurden im Besonderen die vorliegenden Sacherschließungsdaten sowie die fachlichen Schwerpunkte der Medienbestände der Universitätsbibliothek Mannheim berücksichtigt. Das Ziel war die Definition und die Zusammenstellung von Fächern, die im Bibliothekskatalog in unterschiedlichen Varianten umgesetzt und verwendet werden können.
|
8 |
Mehr finden durch schlaueres Suchen: Sacherschliessung auf der 34. Jahrestagung der Gesellschaft für KlassifikationHermes, Hans-Joachim, Pika, Jiri 24 January 2011 (has links)
Vom 21.-23. Juli 2010 fand in Karlsruhe die 34. Jahrestagung der Gesellschaft für Klassifikation statt. In diesem Rahmen tagten an zwei Tagen die Bibliothekare. Es kamen über 60 Teilnehmer aus der BRD, Österreich und der Schweiz. Deren Thema seit jeher ist Inhaltserschließung oder einfacher: Das Suchen und Finden. Unser Motto diesmal: „Mehr finden durch schlaueres Suchen“. Ort der bibliothekarischen Tagung war die KIT-Bibliothek. Vorgetragen wurden 15 Beiträge aus den Bereichen Forschung, Entwicklungen (auch in den beiden Dezimalklassifikationen) sowie Erfahrungsberichte. Im Mittelpunkt stand jeweils das Neue! / The 34th Annual Meeting of the German Classification Society took place in Karlsruhe on 21-23 July 2010. Traditionally included was the meeting of the librarian section on 22-23 July. There were about 60 participants in attendance from Germany, Austria and Switzerland. Their general topic has always been “subject indexing” or more exactly “indexing and retrieval”. This year‟s motto urged: “Find more hits through smarter searches”. The meeting was hosted by the Karlsruhe KIT library. Presented were 15 contributions from the fields of research, reviews and development. Among the subjects: both decimal classifications. The main goal required as ever: It's the novelty that counts! / Le 21-23 Juillet 2010 a été lieu à Karlsruhe la 34e Réunion annuelle de la Société allemand de Classification. Dans ce cadre, les bibliothécaires se sont réunis pour deux jours, le 22-23, selon la tradition. Il y avait environ 60 participants de l'Allemagne, l'Autriche et la Suisse. Leur thème a toujours été le indexation et la recherche, ou plus simplement “Rechercher et Trouver“. Le slogan de cette année a été : ”Trouver plus, par la recherche intelligente”. Lieu de la réunion était la bibliothèque du KIT de Karlsruhe. Ils sont été presenté 15 contributions dans les domaines de la recherche, du développement (également dans les classifications decimales) et des commentaires. L‟objectif principal, comme toujours : C‟est la nouveauté qui compte !
|
9 |
Lösungen suchen – Visionen bewahren / Look for solutions – preserve visions22 December 2011 (has links) (PDF)
In der Rückschau auf Frankfurt 2011 ist festzuhalten:
Es kamen 40 interessierte Kolleginnen und Kollegen. An zwei Tagen hatten wir wieder 13 Vorträge und natürlich ein Beiprogramm (geführte Bibliotheksbesichtigungen).
Nach wie vor ein Adjektiv von Gewicht in den Vorträgen ist „automatisch“ oder „automatisiert“. Es suggeriert die Erzeugung von Schlagwörtern oder Klassifikations-Notationen ohne oder fast ohne intellektuelle Einwirkung der Bibliothekare. Die automatisierte Indexierung braucht allerdings immer "Referenz-Datenpools", um zu funktionieren. Auch die kontinuierliche Weiterentwicklung von Thesauri und Systematiken wird wohl immer von Menschen gemacht werden müssen.
Soviel in aller Kürze zu Neuem in demjenigen Bereich der Bibliothekswelt, der uns in der GfKl angeht: Das inhaltliche Erschließen, Suchen und Finden. / Looking back at Frankfurt it may be stated: 40 colleagues attended our meeting. In two days we listened to 13 speeches. And of course a support program – consisting of library tours – was run.
One of the pre-eminent adjectives in the various contributions was “automatic” or “automated”; it suggests the idea of machine-created notations in a classification system or some kind of a self-generating controlled vocabulary in a system of subject headings. But any system of automated indexing needs pools of reference data – and those cannot be created without intellectual input. Which applies also to the creation of a thesaurus.
That far my very brief introduction into our 2011 investigation into the novelties of that part of the library world that concerns us: Subject indexing or simply search and find.
Hans-J. Hermes
|
10 |
Lösungen suchen – Visionen bewahren: Tagung der Arbeitsgruppen Bibliotheken und Dezimalklassifikationen im Rahmen der 35. Jahrestagung der Gesellschaft für Klassifikation am 31. August und 01. September 2011 in Frankfurt /M.Hermes, Hans-Joachim, Lorenz, Bernd 22 December 2011 (has links)
In der Rückschau auf Frankfurt 2011 ist festzuhalten:
Es kamen 40 interessierte Kolleginnen und Kollegen. An zwei Tagen hatten wir wieder 13 Vorträge und natürlich ein Beiprogramm (geführte Bibliotheksbesichtigungen).
Nach wie vor ein Adjektiv von Gewicht in den Vorträgen ist „automatisch“ oder „automatisiert“. Es suggeriert die Erzeugung von Schlagwörtern oder Klassifikations-Notationen ohne oder fast ohne intellektuelle Einwirkung der Bibliothekare. Die automatisierte Indexierung braucht allerdings immer "Referenz-Datenpools", um zu funktionieren. Auch die kontinuierliche Weiterentwicklung von Thesauri und Systematiken wird wohl immer von Menschen gemacht werden müssen.
Soviel in aller Kürze zu Neuem in demjenigen Bereich der Bibliothekswelt, der uns in der GfKl angeht: Das inhaltliche Erschließen, Suchen und Finden. / Looking back at Frankfurt it may be stated: 40 colleagues attended our meeting. In two days we listened to 13 speeches. And of course a support program – consisting of library tours – was run.
One of the pre-eminent adjectives in the various contributions was “automatic” or “automated”; it suggests the idea of machine-created notations in a classification system or some kind of a self-generating controlled vocabulary in a system of subject headings. But any system of automated indexing needs pools of reference data – and those cannot be created without intellectual input. Which applies also to the creation of a thesaurus.
That far my very brief introduction into our 2011 investigation into the novelties of that part of the library world that concerns us: Subject indexing or simply search and find.
Hans-J. Hermes
|
Page generated in 1.0847 seconds