Tecnologias da web semântica para a recuperação da informação no wikidata

LUZ, Larissa Pavarini da; CONEGLIAN, Caio Saraiva; SEGUNDO, José Eduardo Santarem

Tecnologias da web semântica para a recuperação da informação no wikidata

Tipo

Artigo

Classficação

Nível teórico

Data

2018-11-05

Autores

LUZ, Larissa Pavarini da

CONEGLIAN, Caio Saraiva

SEGUNDO, José Eduardo Santarem

ORCID

http://orcid.org/0000-0002-5493-1148
http://orcid.org/0000-0002-6126-9113
http://orcid.org/0000-0003-3360-7872

Título do Períodico

Revista Digital Biblioteconomia e Ciência da Informação

ISSN

1678-765X

Página(s)/e-location

e019003

Idioma(s)

pt, en

Fonte

Campinas, SP
17

Coleções

RDBCI - Revista Digital de Biblioteconomia e Ciência da Informação

Resumo

A Recuperação da Informação é responsável pelo armazenamento e pela recuperação automática de informação, podendo estes documentos ser constituídos por textos, páginas Web, áudio, vídeo, imagens, gráficos e figuras. Técnicas de Recuperação de Informação ganharam importância com o crescimento da Web, pois a quantidade ilimitada de informação pode expressar as mais diversas formas e níveis de qualidade ao que se espera. Pensando nisso o presente trabalho estuda métodos e tecnologias capazes de recuperar essas informações, dando enfoque a buscar em bases de dados estruturadas chamadas Linked Data, mas especificamente no Wikidata, uma base de dados estruturada utilizando conceitos da Web Semântica, que reúne conhecimentos da Wikipédia. Buscando compreender como é feita essa recuperação da informação no projeto Wikidata, esta pesquisa tem como objetivo apresentar os meios que o Wikidata fornece para a RI e como eles usam os princípios da Web Semântica. A metodologia utilizada foi um estudo exploratório com embasamento para a pesquisa e aplicada, uma vez que testes foram feitos na base de dados do Wikidata. Como resultados, identificou-se características das diversas formas de acesso e de recuperação dos dados, traçando correlações existentes entre cada uma destas formas, com o arcabouço teórico da Web Semântica e da Recuperação da Informação. Concluiu-se que o Wikidata se coloca como uma base de dados sólida, com um grande volume de conteúdo que possui uma série de mecanismos de recuperação, capazes de atender às mais diversas aplicações existentes na Web, devido a estes mecanismos serem construídos com distintas tecnologias e configurações.

Information Retrieval is responsible for the storage and automatic retrieval of information, and these documents may consist of texts, web pages, audio, video, images, graphics and figures. Information Retrieval techniques have gained importance with the growth of the Web, because the unlimited amount of information can express the most diverse forms and levels of quality to what is expected. With this in mind, the present work studies methods and technologies capable of retrieving this information, focusing on searching structured databases called Linked Data, but specifically on the Wikidata project, a database structured using Semantic Web concepts, which brings together the knowledge from Wikipedia. Seeking to understand how this information retrieval is done in the Wikidata project, this research has the objective of presenting the media that Wikidata provides to RI and how they use the principles of the Semantic Web. The methodology used was an exploratory study based on the research and applied, since tests were done in the database of Wikidata. As a result, the characteristics of the various forms of data access and retrieval were identified, tracing the correlations between each of these forms, with the theoretical framework of the Semantic Web and Information Retrieval. It was concluded that Wikidata stands as a solid database, with a large volume of contents, quite current, that has a series of recovery mechanisms, capable of serving the most diverse applications on the Web, because these mechanisms are built with different technologies and configurations.

Palavras-chave

Web semântica, Recuperação da informação, Linked data, Wikidata, Semantic web, Information retrieval, Linked data, Wikidata

Citação

LUZ, Larissa Pavarini da; CONEGLIAN, Caio Saraiva; SEGUNDO, José Eduardo Santarem. Tecnologias da web semântica para a recuperação da informação no wikidata. Revista Digital Biblioteconomia e Ciência da Informação. Campinas, SP, v. 17, p. e019003. 2018-11-05. http://dx.doi.org/10.20396/rdbci.v17i0.8651791. Disponível em: https://www.scielo.br/j/rdbci/a/rwFKmyvkhbwfgXrkGzSDKgg/?lang=pt#. Acesso em: 2024-05-13