• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 18
  • 9
  • 2
  • 1
  • 1
  • Tagged with
  • 35
  • 35
  • 18
  • 13
  • 13
  • 8
  • 8
  • 8
  • 8
  • 7
  • 7
  • 6
  • 6
  • 6
  • 6
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

OntoFeed um leitor de Feeds com extensão ontológica. / Ontofeed: a feed reader with ontological extension.

Marcelo Gomes Rodrigues 23 August 2011 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O problema que justifica o presente estudo refere-se à falta de semântica nos mecanismos de busca na Web. Para este problema, o consórcio W3 vem desenvolvendo tecnologias que visam construir uma Web Semântica. Entre estas tecnologias, estão as ontologias de domínio. Neste sentido, o objetivo geral desta dissertação é discutir as possibilidades de se imprimir semântica às buscas nos agregadores de notícia da Web. O objetivo específico é apresentar uma aplicação que usa uma classificação semi-automática de notícias, reunindo, para tanto, as tecnologias de busca da área de recuperação de informação com as ontologias de domínio. O sistema proposto é uma aplicação para a Web capaz de buscar notícias sobre um domínio específico em portais de informação. Ela utiliza a API do Google Maps V1 para a localização georreferenciada da notícia, sempre que esta informação estiver disponível. Para mostrar a viabilidade da proposta, foi desenvolvido um exemplo apoiado em uma ontologia para o domínio de chuvas e suas consequências. Os resultados obtidos por este novo Feed de base ontológica são alocados em um banco de dados e disponibilizados para consulta via Web. A expectativa é que o Feed proposto seja mais relevante em seus resultados do que um Feed comum. Os resultados obtidos com a união de tecnologias patrocinadas pelo consórcio W3 (XML, RSS e ontologia) e ferramentas de busca em página Web foram satisfatórios para o propósito pretendido. As ontologias mostram-se como ferramentas de usos múltiplos, e seu valor de análise em buscas na Web pode ser ampliado com aplicações computacionais adequadas para cada caso. Como no exemplo apresentado nesta dissertação, à palavra chuva agregaram-se outros conceitos, que estavam presentes nos desdobramentos ocasionados por ela. Isto realçou a ligação do evento chuva com as consequências que ela provoca - ação que só foi possível executar através de um recorte do conhecimento formal envolvido. / The problem addressed in this work refers to the lack of semantics in Web search engine. As solution, the W3 consortium has been developing technologies that aim to build a Semantic Web, including the domain ontology. Considering this issue, the work main goal is to discuss the possibilities of placing semantics context in the searches in Web feed applications. The specific goal is to propose a Web application that uses a semi-automatic classification of news, by joining information retrieval technologies and domain ontology. The software is able to get news about a given domain from Web information portals. It uses the Google Map API VI for gather the new geo-referenced location, whenever this information is available. To show the proposal feasibility, an example was developed supported by an ontology in the domain of rainfall and its consequences. The results of this new ontology-based feed are allocated in a database e make available for query via the Web. It is expected that the proposed feed offers more relevant results than the current feeds. In addition, the union of technologies sponsored by the W3C and traditional search methods on Web pages were satisfactory for the intended purposes. Ontology is showed as multi-use tool and its value in Web search can be extended for appropriate computer applications. In the example presented, other concepts were added to the word rainfall, which is present in the deployments caused by it. This highlighted the connection of the event rainfall with its consequences, action that was only possible to run through a cutout of the formal knowledge involved.
12

Sistema de busca semântica a partir de análise de contextos de uso em sistemas de comunicação alternativa e aumentativa : uma aplicação no SCALA

Perez, Claudia Camerini Côrrea January 2018 (has links)
A Comunicação Alternativa (CA) é a área de conhecimento que pesquisa símbolos, recursos, técnicas e estratégias para desenvolver ou aprimorar a comunicação de pessoas com impossibilidade ou dificuldade de falar e/ou escrever. Tanto usuários como profissionais (terapeutas ocupacionais, fonoaudiólogos e professores) têm necessidade de organizar os recursos de CA no formato de pranchas de comunicação. A construção de pranchas de comunicação é uma atividade que envolve a seleção de elementos gráficos (símbolos gráficos, imagens, desenhos e fotografias), de acordo com as necessidades e objetivos das pessoas que se utilizarão deste recurso. A partir desse cenário, o objetivo desta tese é analisar como um sistema de busca semântica de imagens (pictogramas), capaz de mapear o contexto semântico de domínio específico, poderá aprimorar o SCALA e ampliar o conhecimento acerca de uma Tecnologia Assistiva de Comunicação Alternativa. A partir do objetivo, propôs-se o desenvolvimento de um sistema de busca (SCALAi*) capaz de mapear o contexto semântico de imagens de domínio específico, visando especificar a ontologia, e integra-la a um sistema de busca semântica de imagens, para a construção de pranchas de comunicação no sistema SCALA A metodologia de pesquisa foi de abordagem mixta: pesquisa qualitativa com engenharia de software com o método de Quase Experimento. A pesquisa de cunho tecnológico utilizou a metodologia de Design Centrado no Contexto de Uso para o desenvolvimento do SCALAi*. As oficinas de formação que alicerçaram o Quase Experimento foram realizadas em laboratórios de informática, com a participação de um público de participantes heterogêneo. Os dados foram coletados por meio de instrumentos de observação e protocolos de avaliação respondidos pelos participantes. Os resultados permitiram o desenvolvimento tecnológico do sistema denominado SCALAi* que permite a busca semântica em sistema de Comunicação Alternativa, a construção de uma ontologia de contextos de uso aplicável a sistema de CA, a comprovação da eficiência do sistema de busca nas interações e tempos de construção das pranchas de comunicação e a qualificação do processo de construção, seja em quantidade de pictograma seja em sua organização lógica. A inclusão do SCALAi* em sistema de Comunicação Alternativa se mostrou adequada e eficiente para os usuários, com muita ou nenhuma experiência, em atividades de construção de pranchas comunicação. / The Alternative Communication (AC) is the area of knowledge that researches symbols, resources, techniques and strategies to develop or improve the communication of people with impossibility or difficulty speaking and/or writing. Both users and professionals (occupational therapists, speech therapists and teachers) need to organize CA resources in the form of communication boards. The construction of communication boards is an activity that involves the selection of graphic elements (graphic symbols, images, drawings and photographs), according to the needs and objectives of the people who will use this resource. From this scenario, the aim of this thesis is to analyze how a semantic image search system (pictograms), capable of mapping the specific domain semantic context, can improve the SCALA and increase the knowledge about an Assistive Technology of Alternative Communication. From the objective, the development of a search system (SCALAi*) was proposed, capable of mapping the semantic context of specific domain images, aiming at specifying the ontology, and integrating it into a semantic image search system the construction of communication boards in the SCALA system. The research methodology was a mixed one: qualitative research with software engineering with the Quase Experiment method The research of a technological nature used the methodology of Design Centered in the Context of Use for the development of SCALAi*. The training workshops that founded the Quase Experiment were carried out in computer labs, with the participation of a heterogeneous audience of participants. The data were collected through observation instruments and evaluation protocols answered by the participants. The results allowed the technological development of the system called SCALAi* that allows the semantic search in Alternative Communication system, the construction of an ontology of contexts of use applicable to the CA system, the verification of the efficiency of the search system in the interactions and times of construction of communication boards and the qualification of the construction process, whether in quantity of pictogram or in its logical organization. The inclusion of SCALAi* in the Alternative Communication system proved to be adequate and efficient for users, with or without experience, in communication board construction activities.
13

OntoFeed um leitor de Feeds com extensão ontológica. / Ontofeed: a feed reader with ontological extension.

Marcelo Gomes Rodrigues 23 August 2011 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O problema que justifica o presente estudo refere-se à falta de semântica nos mecanismos de busca na Web. Para este problema, o consórcio W3 vem desenvolvendo tecnologias que visam construir uma Web Semântica. Entre estas tecnologias, estão as ontologias de domínio. Neste sentido, o objetivo geral desta dissertação é discutir as possibilidades de se imprimir semântica às buscas nos agregadores de notícia da Web. O objetivo específico é apresentar uma aplicação que usa uma classificação semi-automática de notícias, reunindo, para tanto, as tecnologias de busca da área de recuperação de informação com as ontologias de domínio. O sistema proposto é uma aplicação para a Web capaz de buscar notícias sobre um domínio específico em portais de informação. Ela utiliza a API do Google Maps V1 para a localização georreferenciada da notícia, sempre que esta informação estiver disponível. Para mostrar a viabilidade da proposta, foi desenvolvido um exemplo apoiado em uma ontologia para o domínio de chuvas e suas consequências. Os resultados obtidos por este novo Feed de base ontológica são alocados em um banco de dados e disponibilizados para consulta via Web. A expectativa é que o Feed proposto seja mais relevante em seus resultados do que um Feed comum. Os resultados obtidos com a união de tecnologias patrocinadas pelo consórcio W3 (XML, RSS e ontologia) e ferramentas de busca em página Web foram satisfatórios para o propósito pretendido. As ontologias mostram-se como ferramentas de usos múltiplos, e seu valor de análise em buscas na Web pode ser ampliado com aplicações computacionais adequadas para cada caso. Como no exemplo apresentado nesta dissertação, à palavra chuva agregaram-se outros conceitos, que estavam presentes nos desdobramentos ocasionados por ela. Isto realçou a ligação do evento chuva com as consequências que ela provoca - ação que só foi possível executar através de um recorte do conhecimento formal envolvido. / The problem addressed in this work refers to the lack of semantics in Web search engine. As solution, the W3 consortium has been developing technologies that aim to build a Semantic Web, including the domain ontology. Considering this issue, the work main goal is to discuss the possibilities of placing semantics context in the searches in Web feed applications. The specific goal is to propose a Web application that uses a semi-automatic classification of news, by joining information retrieval technologies and domain ontology. The software is able to get news about a given domain from Web information portals. It uses the Google Map API VI for gather the new geo-referenced location, whenever this information is available. To show the proposal feasibility, an example was developed supported by an ontology in the domain of rainfall and its consequences. The results of this new ontology-based feed are allocated in a database e make available for query via the Web. It is expected that the proposed feed offers more relevant results than the current feeds. In addition, the union of technologies sponsored by the W3C and traditional search methods on Web pages were satisfactory for the intended purposes. Ontology is showed as multi-use tool and its value in Web search can be extended for appropriate computer applications. In the example presented, other concepts were added to the word rainfall, which is present in the deployments caused by it. This highlighted the connection of the event rainfall with its consequences, action that was only possible to run through a cutout of the formal knowledge involved.
14

Sistema de busca semântica a partir de análise de contextos de uso em sistemas de comunicação alternativa e aumentativa : uma aplicação no SCALA

Perez, Claudia Camerini Côrrea January 2018 (has links)
A Comunicação Alternativa (CA) é a área de conhecimento que pesquisa símbolos, recursos, técnicas e estratégias para desenvolver ou aprimorar a comunicação de pessoas com impossibilidade ou dificuldade de falar e/ou escrever. Tanto usuários como profissionais (terapeutas ocupacionais, fonoaudiólogos e professores) têm necessidade de organizar os recursos de CA no formato de pranchas de comunicação. A construção de pranchas de comunicação é uma atividade que envolve a seleção de elementos gráficos (símbolos gráficos, imagens, desenhos e fotografias), de acordo com as necessidades e objetivos das pessoas que se utilizarão deste recurso. A partir desse cenário, o objetivo desta tese é analisar como um sistema de busca semântica de imagens (pictogramas), capaz de mapear o contexto semântico de domínio específico, poderá aprimorar o SCALA e ampliar o conhecimento acerca de uma Tecnologia Assistiva de Comunicação Alternativa. A partir do objetivo, propôs-se o desenvolvimento de um sistema de busca (SCALAi*) capaz de mapear o contexto semântico de imagens de domínio específico, visando especificar a ontologia, e integra-la a um sistema de busca semântica de imagens, para a construção de pranchas de comunicação no sistema SCALA A metodologia de pesquisa foi de abordagem mixta: pesquisa qualitativa com engenharia de software com o método de Quase Experimento. A pesquisa de cunho tecnológico utilizou a metodologia de Design Centrado no Contexto de Uso para o desenvolvimento do SCALAi*. As oficinas de formação que alicerçaram o Quase Experimento foram realizadas em laboratórios de informática, com a participação de um público de participantes heterogêneo. Os dados foram coletados por meio de instrumentos de observação e protocolos de avaliação respondidos pelos participantes. Os resultados permitiram o desenvolvimento tecnológico do sistema denominado SCALAi* que permite a busca semântica em sistema de Comunicação Alternativa, a construção de uma ontologia de contextos de uso aplicável a sistema de CA, a comprovação da eficiência do sistema de busca nas interações e tempos de construção das pranchas de comunicação e a qualificação do processo de construção, seja em quantidade de pictograma seja em sua organização lógica. A inclusão do SCALAi* em sistema de Comunicação Alternativa se mostrou adequada e eficiente para os usuários, com muita ou nenhuma experiência, em atividades de construção de pranchas comunicação. / The Alternative Communication (AC) is the area of knowledge that researches symbols, resources, techniques and strategies to develop or improve the communication of people with impossibility or difficulty speaking and/or writing. Both users and professionals (occupational therapists, speech therapists and teachers) need to organize CA resources in the form of communication boards. The construction of communication boards is an activity that involves the selection of graphic elements (graphic symbols, images, drawings and photographs), according to the needs and objectives of the people who will use this resource. From this scenario, the aim of this thesis is to analyze how a semantic image search system (pictograms), capable of mapping the specific domain semantic context, can improve the SCALA and increase the knowledge about an Assistive Technology of Alternative Communication. From the objective, the development of a search system (SCALAi*) was proposed, capable of mapping the semantic context of specific domain images, aiming at specifying the ontology, and integrating it into a semantic image search system the construction of communication boards in the SCALA system. The research methodology was a mixed one: qualitative research with software engineering with the Quase Experiment method The research of a technological nature used the methodology of Design Centered in the Context of Use for the development of SCALAi*. The training workshops that founded the Quase Experiment were carried out in computer labs, with the participation of a heterogeneous audience of participants. The data were collected through observation instruments and evaluation protocols answered by the participants. The results allowed the technological development of the system called SCALAi* that allows the semantic search in Alternative Communication system, the construction of an ontology of contexts of use applicable to the CA system, the verification of the efficiency of the search system in the interactions and times of construction of communication boards and the qualification of the construction process, whether in quantity of pictogram or in its logical organization. The inclusion of SCALAi* in the Alternative Communication system proved to be adequate and efficient for users, with or without experience, in communication board construction activities.
15

Uma arquitetura para sistemas de busca semântica para recuperação de informações em repositórios de biodiversidade / An architecture for semantic search systems for retrieving information in repositories of biodiversity

Flor Karina Mamani Amanqui 16 May 2014 (has links)
A diversidade biológica é essencial para a sustentabilidade da vida na Terra e motiva numerosos esforços para coleta de dados sobre espécies, dando origem a uma grande quantidade de informação. Esses dados são geralmente armazenados em bancos de dados relacionais. Pesquisadores usam esses bancos de dados para extrair conhecimento e compartilhar novas descobertas. No entanto, atualmente a busca tradicional (baseada em palavras-chave) já não é adequada para ser usada em grandes quantidades de dados heterogêneos, como os de biodiversidade. Ela tem baixa precisão e revocação para esse tipo de dado. Este trabalho apresenta uma nova arquitetura para abordar esse problema aplicando técnicas de buscas semânticas em dados sobre biodiversidade e usando formatos e ferramentas da Web Semântica para representar esses dados. A busca semântica tem como objetivo melhorar a acurácia dos resultados de buscas com o uso de ontologias para entender os objetivos dos usuários e o significado contextual dos termos utilizados. Este trabalho também apresenta os resultados de testes usando um conjunto de dados representativos sobre biodiversidade do Instituto Nacional de Pesquisas da Amazônia (INPA) e do Museu Paraense Emílio Goeldi (MPEG). Ontologias permitem que conhecimento seja organizado em espaços conceituais de acordo com seu significado. Para a busca semântica funcionar, um ponto chave é a criação de mapeamentos entre os dados (neste caso, dados sobre biodiversidade do INPA e MPEG) e termos das ontologias que os descrevem, neste caso: a classificação taxonômica de espécies e a OntoBio, a ontologia de biodiversidade do INPA. Esses mapeamentos foram criados depois que extraímos a classificação taxonômica do site Catalog of Life (CoL) e criamos uma nova versão da OntoBio. Um protótipo da arquitetura foi construído e testado usando casos de uso e dados do INPA e MPEG. Os resultados dos testes mostraram que a abordagem da busca semântica tinha uma melhor precisão (28% melhor) e revocação (25% melhor) quando comparada com a busca por palavras-chave. Eles também mostraram que é possível conectar facilmente os dados mapeados a outras fontes de dados abertas, como a fonte Amazon Forest Linked Data do Instituto Nacional de Pesquisas Espaciais. (INPE) / Biological diversity is of essential value to life sustainability on Earth and motivates many efforts to collect data about species. That gives rise to a large amount of information. Biodiversity data, in most cases, is stored in relational databases. Researchers use this data to extract knowledge and share their new discoveries about living things. However, nowadays the traditional search approach (based basically on keywords matching) is not appropriate to be used in large amounts of heterogeneous biodiversity data. Search by keyword has low precision and recall in this kind of data. This work presents a new architecture to tackle this problem using a semantic search system for biodiversity data and semantic web formats and tools to represent this data. Semantic search aims to improve search accuracy by using ontologies to understand user objectives and the contextual meaning of terms used in the search to generate more relevant results. This work also presents test results using a set of representative biodiversity data from the National Research Institute for the Amazon (INPA) and the Emilio Gueldi Museum in Pará (MPEG). Ontologies allow knowledge to be organized into conceptual spaces in accordance to its meaning. For semantic search to work, a key point is to create mappings between the data (in this case, INPAs and MPEGs biodiversity data) and the ontologies describing it, in this case: the species taxonomy (a taxonomy is an ontology where each class can have just one parent) and OntoBio, INPAs biodiversity ontology. These mappings were created after we extracted the taxonomic classification from the Catalogue of Life (CoL) website and created a new version of OntoBio. A prototype of the architecture was built and tested using INPAs and MPEGs use cases and data. The results showed that the semantic search approach had a better precision (28% improvement) and recall (25% improvement) when compared to keyword based search. They also showed that it was possible to easily connect the mapped data to other Linked Open Data sources, such as the Amazon Forest Linked Data from the National Institute for Space Research (INPE)
16

Sistema de busca semântica a partir de análise de contextos de uso em sistemas de comunicação alternativa e aumentativa : uma aplicação no SCALA

Perez, Claudia Camerini Côrrea January 2018 (has links)
A Comunicação Alternativa (CA) é a área de conhecimento que pesquisa símbolos, recursos, técnicas e estratégias para desenvolver ou aprimorar a comunicação de pessoas com impossibilidade ou dificuldade de falar e/ou escrever. Tanto usuários como profissionais (terapeutas ocupacionais, fonoaudiólogos e professores) têm necessidade de organizar os recursos de CA no formato de pranchas de comunicação. A construção de pranchas de comunicação é uma atividade que envolve a seleção de elementos gráficos (símbolos gráficos, imagens, desenhos e fotografias), de acordo com as necessidades e objetivos das pessoas que se utilizarão deste recurso. A partir desse cenário, o objetivo desta tese é analisar como um sistema de busca semântica de imagens (pictogramas), capaz de mapear o contexto semântico de domínio específico, poderá aprimorar o SCALA e ampliar o conhecimento acerca de uma Tecnologia Assistiva de Comunicação Alternativa. A partir do objetivo, propôs-se o desenvolvimento de um sistema de busca (SCALAi*) capaz de mapear o contexto semântico de imagens de domínio específico, visando especificar a ontologia, e integra-la a um sistema de busca semântica de imagens, para a construção de pranchas de comunicação no sistema SCALA A metodologia de pesquisa foi de abordagem mixta: pesquisa qualitativa com engenharia de software com o método de Quase Experimento. A pesquisa de cunho tecnológico utilizou a metodologia de Design Centrado no Contexto de Uso para o desenvolvimento do SCALAi*. As oficinas de formação que alicerçaram o Quase Experimento foram realizadas em laboratórios de informática, com a participação de um público de participantes heterogêneo. Os dados foram coletados por meio de instrumentos de observação e protocolos de avaliação respondidos pelos participantes. Os resultados permitiram o desenvolvimento tecnológico do sistema denominado SCALAi* que permite a busca semântica em sistema de Comunicação Alternativa, a construção de uma ontologia de contextos de uso aplicável a sistema de CA, a comprovação da eficiência do sistema de busca nas interações e tempos de construção das pranchas de comunicação e a qualificação do processo de construção, seja em quantidade de pictograma seja em sua organização lógica. A inclusão do SCALAi* em sistema de Comunicação Alternativa se mostrou adequada e eficiente para os usuários, com muita ou nenhuma experiência, em atividades de construção de pranchas comunicação. / The Alternative Communication (AC) is the area of knowledge that researches symbols, resources, techniques and strategies to develop or improve the communication of people with impossibility or difficulty speaking and/or writing. Both users and professionals (occupational therapists, speech therapists and teachers) need to organize CA resources in the form of communication boards. The construction of communication boards is an activity that involves the selection of graphic elements (graphic symbols, images, drawings and photographs), according to the needs and objectives of the people who will use this resource. From this scenario, the aim of this thesis is to analyze how a semantic image search system (pictograms), capable of mapping the specific domain semantic context, can improve the SCALA and increase the knowledge about an Assistive Technology of Alternative Communication. From the objective, the development of a search system (SCALAi*) was proposed, capable of mapping the semantic context of specific domain images, aiming at specifying the ontology, and integrating it into a semantic image search system the construction of communication boards in the SCALA system. The research methodology was a mixed one: qualitative research with software engineering with the Quase Experiment method The research of a technological nature used the methodology of Design Centered in the Context of Use for the development of SCALAi*. The training workshops that founded the Quase Experiment were carried out in computer labs, with the participation of a heterogeneous audience of participants. The data were collected through observation instruments and evaluation protocols answered by the participants. The results allowed the technological development of the system called SCALAi* that allows the semantic search in Alternative Communication system, the construction of an ontology of contexts of use applicable to the CA system, the verification of the efficiency of the search system in the interactions and times of construction of communication boards and the qualification of the construction process, whether in quantity of pictogram or in its logical organization. The inclusion of SCALAi* in the Alternative Communication system proved to be adequate and efficient for users, with or without experience, in communication board construction activities.
17

Semantic search in historical documentation

Wiklund, Edvin, Maranan Hansson, Ivan Kelly January 2024 (has links)
Many organisations face problems with data digitisation and continuous data gathering. They often gather and store this data in outdated systems that are difficult to search through. In our thesis, we utilise the engineering method to investigate the feasibility of incorporating artificial intelligence to search a large corpus of data and find accurate answers. To achieve the thesis goal, we conducted a literature review, studying existing solutions that enhance flexibility and facilitate artificial intelligence operations to search in databases. This resulted in the choice of utilising OpenSearch. Within OpenSearch, we conducted an experiment investigating which sentence transformer for embedding the contextual meaning of sentences could be best utilised for semantic search in the database. We then evaluated the sentence transformers´s performance with the MS MARCO dataset measuring both speed and accuracy. Through the experiment we found two sentence transformers that outperformed the rest by a slight margin and that all the sentence transformers performed similarly overall. A notable result is that the sentence transformers specifically dedicated to semantic search and sentence transformers with larger dimensions did not perform better. Further, these results showed the easy combination of existing search engines that incorporate artificial intelligence to semantically search in the documentation and showed that this could be used within organisations to handle a large corpus of data.
18

Semantisk eller keywords? : En studie av interna sökfunktioner och användarens upplevelse

Strand, Charlotte January 2023 (has links)
The idea for this study is based on a collaboration with Södra Skogsägarna Ekonomisk Förening, one of Sweden's leading forest industries, who wanted to investigate the possibilities of a new internal search function on its public website, primarily with the help of Azure Cognitive Search. Before and in connection with the implementation of a new search function, the following questions aimed to be answered: • RQ1: How does semantic search differ from keyword search? What are the limitations of semantic search today? • RQ2: In what ways does the user experience of the new search function differ from the old search function? To find answers to the questions, a literature study was conducted and case studies consisting of a survey among the website's visitors and two different user surveys. The literature study aimed to answer RQ1 and form a knowledge base for the design of the new search function by examining the search engine's history, the difference between a keyword-based search function and a semantic search function, and looking at how one expects today's smart search functions to develop. The survey included questions about visitors' use of the existing search function and perception of it. User survey number 1 was conducted with a select group of participants. The survey consisted of a number of tasks that would be performed using the existing search function to get a better picture of the user experience and help answering RQ2. When the new search function was ready for testing, User Survey number 2 was conducted where participants compared the old and the new search function by performing the same tasks with both solutions open in parallel windows. The study showed that the majority of the participants in the survey perceived the old search function as effective enough to make them satisfied. User survey 1 suggested that relevant results came too far down the results list or no relevant results were obtained at all. After implementing Azure Cognitive Search with a semantic feature enabled, test participants were able to ask questions in the search box and get answers directly at the top of the results list, which made the new search feature preferred over the old one. The literature study showed how keyword-based search is based on the principle of keywords and its occurrence in the searchable index, while a semantic search function tries to interpret the meaning behind the search term instead. / Idén till denna studie grundar sig ett samarbete med Södra Skogsägarna Ekonomisk Förening, en av Sveriges ledande skogsindustrier, som ville undersöka möjligheterna med en ny intern sökfunktion på sin publika webbplats, främst med hjälp av Azure Cognitive Search. Inför och i samband med implementeringen av en ny sökfunktion ville man besvara följande frågeställningar:   ·       RQ1: Hur skiljer sig semantisk sökning i jämförelse med sökning mot nyckelord (keywords)? Vilka begränsningar finns det med semantisk sökning idag?’ ·       RQ2: På vilka sätt skiljer sig användarupplevelsen av den nya sökfunktionen med semantisk funktion i jämförelse med den gamla, nyckelordsbaserade sökfunktionen?   För att söka svar på frågeställningarna gjordes en litteraturstudie samt fallstudier bestående av en enkät bland webbplatsens besökare och två olika användarundersökningar. Litteraturstudien ämnade besvara RQ1 och utgöra en kunskapsgrund inför utformningen av den nya sökfunktionen genom att undersöka sökmotorns historia, skillnaden mellan en nyckelordsbaserad sökfunktion och en semantisk sökfunktion samt se på hur man förväntar sig att dagens smarta sökfunktioner kommer att utvecklas. Enkäten innehöll frågor om besökarnas användande av den befintliga sökfunktionen och uppfattningen om den. Användarundersökning 1 utfördes med en utvald skara deltagare. Undersökningen bestod av ett antal uppgifter som skulle utföras med hjälp av den befintliga sökfunktionen för att få en bättre bild av användarupplevelsen och hjälpa till att besvara RQ2. När den nya sökfunktionen var klar för test gjordes Användarundersökning 2 där man lät deltagarna jämför den gamla och den nya sökfunktionen genom att utföra samma uppgifter med båda lösningarna parallellt.   Studien visade att majoriteten av deltagarna i enkäten upplevde den gamla sökfunktionen som tillräckligt effektiv för att göra dem nöjda. Användarundersökning 1 antydde att relevanta resultat kom för långt ner i resultatlistan eller så fick man inga relevanta resultat alls. Efter implementering av Azure Cognitive Search med en semantisk funktion påkopplad kunde testdeltagarna ställa frågor i sökrutan och få svar direkt högst upp i resultatlistan, vilket gjorde att den nya sökfunktionen föredrogs framför en gamla. Litteraturstudien visade på hur nyckelordsbaserat sök grundar sig på principen om nyckelord, keywords och dess förekomst i det sökbara indexet medan en semantisk sökfunktion försöker tolka meningen bakom söktermen i stället.
19

Knowledge Driven Search Intent Mining

Jadhav, Ashutosh 31 May 2016 (has links)
No description available.
20

Development of a Semantic Search Tool for Swedish Legal Judgements Based on Fine-Tuning Large Language Models

Mikkelsen Toth, Sebastian January 2024 (has links)
Large language models (LLMs) are very large deep learning models which are retrained on a huge amount of data. Among the LLMs are sentence bidirectional encoder representations from transformers (SBERT) where advanced training methods such as transformer-based denoising autoEncoder (TSDAE), generative query network (GenQ) and an adaption of generative pseudo labelling (GPL) can be applied. This thesis project aims to develop a semantic search tool for Swedish legal judgments in order to overcome the limitations of traditional keyword searches in legal document retrieval. For this aim, a model adept at understanding the semantic nuances of legal language has been developed by leveraging natural language processing (NLP) and fine- tuning LLMs like SBERT, using advanced training methods such as TSDAE, GenQ, and an adaption of GPL. To generate labeled data out of unlabelled data, a GPT3.5 model was used after it was fine-tuned. The generation of labeled data with the use of a generative model was crucial for this project to train the SBERT efficiently. The search tool has been evaluated. The evaluation demonstrates that the search tool can accurately retrieve relevant documents based on semantic queries and simnifically improve the efficiency and accuracy of legal research. GenQ has been shown to be the most efficient training method for this use case.

Page generated in 0.0657 seconds