Uma ontologia para buscas e descrição de trabalhos científicos

Helton Eduardo Ritter1, Maycon Viana Bordin1, Michele Lermen2
1Acadêmicos do curso de Sistemas de Informação, Sociedade Educacional Três de Maio (SETREM)
Av. Santa Rosa, 2405 Três de Maio – RS – CEP 98910-000
2Professora de Web Semântica – Sociedade Educacional Três de Maio (SETREM)
{heltonritter, mayconbordin, prof.michelelermen }@gmail.com

Abstract. Scientific productions repositories normally makes the texts be located using textual attributes like title, key words and descriptions, these informations however are focused in human understanding. In the semantic web, machines would have capacity to understand and make inferences about the content. This paper show the purpose of an ontology to describe scientific productions, making then possible semantics app's use these content.

Resumo. Repositórios de produções científicas normalmente fazem os textos  serem encontrados através de atributos textuais como título, palavras chaves e descrições, esta informação entretanto é voltada para compreensão do humano. Na web semântica, máquinas teriam a capacidade de entender  fazer inferências sobre o conteúdo. Apresenta-se neste artigo a proposta de uma ontologia para descrição de produções científicas, possibilitando assim aplicações semânticas fazerem uso deste conteúdo.

1. Introdução


Diversas instituições de ensino mantêm, ou tem planos de criar portais onde o público interno e externo tenha acesso a trabalhos, artigos e pesquisas produzidas no âmbito institucional e que os autores concordam em os compartilhar.

A SETREM, alinhada com a missão “Produzir, desenvolver e socializar o conhecimento para promoção de qualidade de vida, alicerçada nos valores cristãos” [SETREM, 2011] tem a cerca de dois anos o projeto de criar o portal “conhecimento.setrem.com.br” onde artigos, trabalhos de práticas profissionais da faculdade, trabalhos finais de cursos do ensino técnico, produções de docentes e outros trabalhos de cunho científico fiquem disponíveis ao público.

O projeto (não implementado ainda) disponibilizaria a busca desses trabalhos pelos métodos tradicionais, buscas por título, ano, autor, orientador, curso relacionado, palavras chave, enfim, da maneira como a maioria dos portais deste tipo faz. Este trabalho propõe-se a discutir a possibilidade e as implicações de uso de uma ontologia que possibilite a descrição semântica dos trabalhos.

2. Sobre a web semântica

Na web semântica tanto seres humanos quanto máquinas poderiam fazer inferências sobre o conteúdo. Um agente de software teria capacidade de processar uma informação genérica de modo a extrair dela os elementos que precisa para tomar uma decisão autônoma, sem a interferência do usuário, que hoje é quem infere significado a informação.

O agente de software não compreende realmente a informação, mas através de uma metainformação tem a capacidade de processá-la. Em uma proposição como a deste artigo, o agente poderia ser capaz de trazer trabalhos relacionados, como tendo “schedule”, “agenda”  e “planejamento da produção” em palavras chaves de diferentes trabalhos, mas que no contexto de “Sistemas de produção” tem o mesmo significado, ou fortemente relacionado. Veja que o significado é dado pelo contexto, e esse contexto deve ser conhecido pelo agente de software. O modo de fazê-lo conhecer é criando ontologias.

De acordo com Bernes-Lee e Hendler (2002), “ontologies are collections of statements written in a language such as RDF that define the relations between concepts and specify logical rules for reasoning about them. Computers will “understand” the meaning of semantic data on a Web page by following links to specified ontologies".

Outra definição de ontologia é a de Schulze-Kremer (2001), que define como “a concise and unambiguous description of what principle entities are relevant to an application domain and the relationships between them”.

Na prática, uma ontologia é descrita em um arquivo XML/RDF, onde são escritas estruturas que iniciam com um sujeito, verbo e objeto, assim o RDF (Resource Description Framework) contém asserções sobre coisas particulares (pessoas, páginas web ou qualquer coisa) tem propriedades (como “ser irmã de”, “ser autor de”) e valores (outra pessoa, outra página web). Essa estrutura torna natural a descrição da vasta maioria de dados processados por máquinas [BERNERS-LEE e HENDLER, 2002]. Este formato também é chamado de lógica de primeira ordem.

3. Trabalhos relacionados

Alguns trabalhos já realizados relacionam-se a este, cada um com foco particular, mas em essência fazendo uso das mesmas teorias, e buscando os resultados a partir de métodos semelhantes aos propostos por este artigo.

O projeto da Dra. Larisa Saldatova e Dra. Maria Liakata, (University of Wales) [SALDATOVA e LIAKATA, 2007] denominado “An onytology and methodology and CISP – The proposed Core Information about Scientific Papers” analisa os trabalhos e propõe marcações de metainformações (oito principais, citadas na conclusão) ... 

Artigo completo aqui: http://dl.dropbox.com/u/25481529/artigo_web_semantica1.pdf

Referências

BERNERS-LEE, Tim, HENDLER, James, LASSIL, Ora. The Semantic Web, a new form of web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, April, 2002.

MAKAGONOV, Pavel, FIGUEROA, Alejandro Ruiz, SBOYCHAKOV, Konstantin, GELBUKH, Alexander. Learning a Domain Ontology from Hierarchically Structured Texts. Preceedings of the 22nd International Conference on Machine Learning, Bonn, Germany, 2005.

MILWARD, David, BJÄRELAND, Marcus, HAYES, Willian, MAXWELL, Michelle, ÖBERG, Lisa, TILFORD, Nick, THOMAS, James, HALE, Roger, KNIGHT, Sylvia and BARNES, Julie (2005), Ontology-based interactive information extraction from scientific abstracts. Comparative and Functional Genomics, 6: 67–71. doi: 10.1002/cfg.456

SALDATOVA, Larisa, LIAKATA, Maria. An ontology metodology and CISP – The proposed Core Information about Scientific Papers. The University of Wales, Aberystwyt, 2007.

SETREM, Quem Somos. Disponível em acesso em 21. Ago. 2011.

Schulze-Kremer, S., 2001, Ontologies for Molecular Biology. Computer and Information Sci. 6(21)

2011-09-29 15:43:00
Este é o antigo Live Helton

Então, português é minha língua mãe, eu não tenho tanto a aprender quanto nos demais idiomas, assim este blog não discute aprendizado do idioma, e sim tópicos randômicos de interesse do dia a dia. Tecnologia, desenvolvimento, um pouco de reflexão crítica, enfim, uma bagunça bem como nossa mente é.
RSS Feed
"A vida é curta demais para ser pequena / The live is so short to be small / Das leben zu kurz sind für kleine sein". (Benjamin Disraeli)