Lightbase e a Web Semântica

O LightBase é um banco de dados textual multimídia que reúne, de forma única, um ambiente de desenvolvimento rápido de aplicações e um poderoso servidor de dados multidimensional com recuperação textual pronto para a Web Semântica.

Conteúdo
Índice
O que é a Web Semântica?
Dados linkados
Vocabulários e Ontologias
Consulta
Inferência
Aplicações Verticais

O que é a Web Semântica

O Lightbase Neo está completamente adaptado às ferramentas e métodos da Web Semântica. Conheça aqui como elas funcionam.

A Web Semântica ou Web dos Dados trata da nova especificação da Internet coordenada pelo W3C onde não basta apenas apresentar os dados: é preciso fornecê-los de forma a serem mais facilmente encontrados e possam ser recuperados por outras ferramentas. O objetivo é trabalhar com dados interconectados, facilitando ao usuário encontrar mais facilmente informações de acordo com seu interesse.


Na Web Semântica, Dados Linkados são organizados através de Vocabulários e Ontologias para facilitar a Consulta. A partir daí é possível realizar a Inferência sobre os dados e desenvolver Aplicações Verticais que extraiam o maior potencial possível dos dados. O Lightbase Neo está totalmente adaptado a esse conceito, ao fornecer um motor de extração e importação de dados nos formatos da Web Semântica.


Para conhecer mais sobre a Web Semântica e seus conceitos acesse o site do W3C: http://www.w3c.br/Padroes/WebSemantica


Dados Linkados

A Web de Dados trata de um ambiente onde existem vários sistemas desenvolvidos em diferentes tecnologias que publicam na Internet conteúdos sobre os mais variados assuntos. Se fizermos uma busca no Google sobre temas específicos como “amor” ou “ódio” encontraremos muitos endereços diferentes que tratam sobre o mesmo tema. A organização e classificação dos temas em uma engine de busca obedece a uma lógica que envolve relações entre diferentes páginas de Internet, o já famoso algoritmo de page rank.

Contudo, somente organizar endereços de Internet pode não ser suficiente. Ao navegar por um determinado endereço onde se busca uma informação, pode ser do interesse do usuário encontrar mais sobre o mesmo tema dentro do contexto de sua navegação. É preciso então classificar a informação associando-a a algum conteúdo, e o ato de conectar conteúdos dentro do mesmo contexto chamamos de linkar ou conectar dados.

Na Web Semântica, a utilização de um padrão aberto para catalogação dos dados permite a construção de aplicações verticais que façam inferências e apresentem conteúdos de diferentes fontes.

Se desejar conhecer mais sobre o assunto, acesse o endereço http://www.w3.org/standards/semanticweb/data

Voltar ao topo

Vocabulários e ontologias

Segundo o W3C:


Na Web Semântica, vocabulários definem os conceitos e relações (também conhecidos como “termos”) utilizados para descrever e representar uma área do conhecimento.


Podemos inferir então que os vocabulários funcionam como ferramentas conceituais que nos ajudam a descrever os dados e seus formatos. Trazendo o conceito para algo mais próximo da realidade, imagine um arquivo XML no seguinte formato:



<?xml version=”1.0”?>
<cotacao data=”28/06/2012”>
	<compra>2,0897</compra>
	<venda>2,0904</venda>
</cotacao>


Pode ser difícil para alguém que não tem conhecimento da língua portuguesa entender que o dado acima trata da cotação de uma moeta em uma determinada data. O Arquivo XML resolve muito bem o problema de fornecimento do dado, mas sem uma ontologia associada não é possível entender o significado do dado fornecido.

Agora imaginemos um outro exemplo utilizando o padrão RDF com uma ontologia associada:


<?xml version="1.0"?> 
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
	xmlns:p="http://example.com/ontology#" >
	
	<rdf:Description rdf:about="http://example.com/cotacao/28062012">
		<p:compra> R$ 2,0897</p:compra>
		<p:venda>R$ 2,0904</p:venda>
	</rdf:Description>
</rdf:RDF>


Dentro do arquivo fornecido está descrito um namespace p, que contém a informação do que são tratados os dados. Ao acessar o endereço fornecido no namespace p (http://example.com/ontology#) será possível entender os possíveis valores para as tags p:compra e p:venda, informando tratar-se de valores para compra e venda da moeda.

Não há diferenças claras entre ontologias e vocabulários, mas o padrão é utilizar o termo “ontologia” para coleções mais complexas de termos, ou com um formalismo mais acentuado. Já “vocabulários” tratam de exemplos onde não é necessário um formalismo tão explícito ou o sentido é menos bem definido.

Para conhecer mais sobre vocabulários e ontologias acesse a página do W3C: http://www.w3.org/standards/semanticweb/ontology

Voltar ao topo

Consulta

Segundo o conceito do W3C:

Consultas no contexto da Web Semântica significam tecnologias e protocolos de comunicação para recuperar informação na Web dos Dados.

Num banco de dados relacional a recuperação dos dados é feita através da linguagem SQL, que utiliza os conceitos algébricos de relacionamento para recuperar dados em um formato relacional. Já sabemos que, na Web dos Dados, as informações estão em padrões que não respeitam necessariamente o formato relacional. Na notação da Web Semântica, a descrição do dado deve obedecer a uma definição lógica possuindo a estrutura Sujeito, Predicado e Objeto, conhecida como estrutura de triplas.

Na estrutura de triplas as consultas podem ser feitas com base somente no campo que se deseja procurar e o campo onde está o dado que se deseja buscar. Assim, uma nova especificação de consulta conhecida como SPARQL foi criada para buscar dados armazenados no formato da Web Semântica.

Para conhecer mais sobre SPARQL e sua sintaxe de consulta acesse o endereço http://www.w3.org//standards/semanticweb/query

Voltar ao topo

Inferência

De maneira geral a inferência pode ser definida como a descoberta de novas relações entre os dados. Utilizando técnicas de consulta e agrupamento de dados disponibilizados em formato aberto, pode-se utilizar ainda as informações sobre os dados presentes em vocabulários e criar novas ferramentas de consulta. Enquanto vocabulários e ontologias apresentam relações entre os dados no formato de classes e subclasses, regras de inferência podem ser utilizadas para descobrir relações entre os dados que não estavam previstas em sua definição.

Em exemplo de inferência está em relações semânticas não definidas no vocabulário mas possíveis de explicitação através da lógica. Tomemos como exemplo a sentença:

Simba é um leão.

Agora consideremos uma outra sentença definida em um vocabulário adicional:

Todo leão é um mamífero.

Das duas sentenças podemos concluir facilmente que:

Simba é um mamífero

A descobertas de relações com a utilização de diferentes vocabulários é o que chamamos de inferência.

Mais informações sobre inferência e suas regras podem ser encontradas no endereço http://www.w3.org//standards/semanticweb/inference

Voltar ao topo

Aplicações Verticais

Uma vez que os dados estão armazenados em algum sistema, para que tenham realmente alguma validade é preciso inventar formas de visualizá-los. Quase todo sistema de internet tem o foco na interface com o usuário, e muitas organizações públicas e privadas desenvolvem seus portais na esperança de conseguir transmitir informações ao seu público consumidor, sejam eles clientes em potencial (caso das empresas) ou apenas cidadãos (caso dos governos).

Contudo, por mais que as empresas possuam equipes de desenvolvimento competentes, nenhum sistema é capaz de atender totalmente às necessidades dos usuários. Ao disponibilizar os dados no formato da Web Semântica tanto empresas quanto governos estão fornecendo aos interessados oportunidades de apresentar as informações da forma que lhes for mais conveniente.

No Brasil, com a Lei do Acesso à Informação, os governos têm a obrigação de disponibilizar as informações ao cidadão, de preferência no formato da Web Semântica. Uma vez disponibilizados, os dados permitem a criação por parte do cidadão de aplicações que não só apresentam os dados de governo, mas permitem a descoberta de valiosas informações no que tange à administração do país. Já existe até mesmo um Portal Governamental que cataloga os aplicativos já desenvolvidos com os dados disponibilizados no Portal de Dados Abertos do Governo Federal. Ao utilizar o Lightbase Neo, o cliente dispõe de uma tecnologia cuja publicação dos dados e integração com o Portal de Dados Abertos acontece de forma automática.

Voltar ao topo