Opa, beleza?!
O YAGO é o nosso assunto de hoje, ele é um projeto conjunto do Max Planck Institute for Informatics e a Telecom ParisTech University. YAGO é uma enorme base de conhecimento semântico, derivada a partir da Wikipédia, WordNet e GeoNames. Atualmente contem conhecimento de mais de 10 milhões de entidades como: pessoas, organizações, cidades, entre outros e, contém mais de 120 milhões de fatos sobre essas entidades.
Características
- A precisão do YAGO foi avaliada e comprovada em 95%, cada relação é anotada com seu valor de confiança.
- Combina a taxonomia limpado WordNet com a riqueza do sistema de categorias da Wikipedia, atribuindo as entidades a mais de 350.000 classes.
- É uma ontologia ancorada no tempo e no espaço. Atribui uma dimensão temporal e uma dimensão espacial a muito de seus fatos e entidades.
- Além de uma taxonomia, contem domínios temáticos como “música ou ciência” da WordNet Domains.
- O YAGO extrai e combina entidades e fatos de 10 Wikipédias em diferentes idiomas.
Para mais informações, artigos e outras publicações acesse o site oficial do projeto.
Instalação
Para obter o YAGO você pode baixa-lo aqui, se quiser o código fonte você também encontra no Github.
Fonte: MPI INF MPG