CoBiS

ONTOLOGIA E QUERY SPARQL

La trasformazione dei dati bibliografici in Linked Data richiede che tutte le informazioni contenute nei cataloghi siano rimodellate in RDF (Resource Description Framework), il formalismo del W3C che prevede che ogni informazione sia espressa sotto forma di triple soggetto-predicato-oggetto. Esistono diversi modelli (ontologie, secondo la terminologia tecnica) per organizzare le informazioni in RDF: in ambito bibliografico, nel 2012 la Library of Congress ha pubblicato BIBFRAME, un'ontologia nata per favorire il passaggio dal modello catalografico basato su MARC al Web semantico dei Linked Data.

BIBFRAME è un modello dati che pone al centro della descrizione non il record catalografico nel suo complesso, ma le singole entità che popolano il dominio bibliografico; consente di individuare tali entità in maniera univoca e di mostrare le relazioni tra le entità stesse esplicitando la natura semantica della correlazione. Ispirandosi parzialmente al modello FRBR, permette la distinzione tra i diversi livelli concettuali che caratterizzano l'ambito bibliografico, dall'astrazione di più alto livello (l'opera), alle sue manifestazioni (le istanze), fino all’oggetto/libro custodito dalle biblioteche (l’item).

Ontologia Bibframe

Nel corso del 2018 il progetto del CoBiS ha recepito il rilascio dell’ultima versione dell'ontologia da parte della Library of Congress. BIBFRAME 2.0 organizza le informazioni relative a una determinata risorsa sulla base di tre livelli: Work, Instance e Item.

Il Work (http://id.loc.gov/ontologies/bibframe/Work) rappresenta il livello più astratto collegato alla risorsa (“a conceptual essence of a cataloging resource”) ed è legato ad altre entità che consentono di reperire informazioni, come il titolo e gli autori. In particolare, gli autori sono collegati all’opera tramite l’entità Contribution (http://id.loc.gov/ontologies/bflc/Contribution), la quale può essere istanza di Primary Contribution o Secondary Contribution, in modo da distinguere gli autori primari dagli autori secondari

L’Instance (http://id.loc.gov/ontologies/bibframe/Instance) consente di individuare una specifica manifestazione (o edizione, nel caso del CoBiS) dell'opera, riportando ad esempio informazioni sull’editore e su luogo e data di pubblicazione; molte informazioni del catalogo del CoBiS sono collegate a questo tipo di entità, che è infatti normalmente al centro dell'attività di catalogazione da parte delle biblioteche.

Il concetto di Item (http://id.loc.gov/ontologies/bibframe/Item) è stato introdotto nel 2018, nella versione BIBFRAME 2.0, e identifica una specifica copia fisica o digitale di un'istanza, consentendo, per esempio, di registrare le informazioni relative alla collocazione della copia in una determinata biblioteca. (La documentazione su BIBFRAME 2.0 è consultabile direttamente sul sito curato dalla Library of Congress).

Il progetto LOD del CoBiS utilizza anche alcuni subset di note ontologie standard (come schema.org, RDFS, OWL, DCTerms, FOAF e Culturalis) con lo scopo di aumentare l'interoperabilità semantica dei dati; alcune proprietà custom sono state invece introdotte per rappresentare informazioni specifiche del progetto, che non potevano essere espresse in maniera efficace utilizzando le ontologie standard.

Questo è l’elenco degli IRI delle ontologie usate, ognuno associato a un prefisso.

  • bf: http://bibframe.org/vocab/
  • bf2: http://id.loc.gov/ontologies/bibframe/
  • bflc: http://id.loc.gov/ontologies/bflc/
  • schema: http://schema.org/
  • dcterm: http://purl.org/dc/terms/
  • rdfs: http://www.w3.org/2000/01/rdf-schema#
  • owl: http://www.w3.org/2002/07/owl#
  • cobis: http://dati.cobis.to.it/vocab/
  • foaf: http://xmlns.com/foaf/0.1/

Imposta anche tu una query ed interroga il catalogo CoBiS LOD attraverso il punto di accesso per le query SPARQL oppure prova una delle query proposte.

Quali sono i titoli delle opere che sono costituite da più parti o fascicoli?

PREFIX bf2: <http://id.loc.gov/ontologies/bibframe/>

select distinct ?work ?workTitle where {
  ?subWork a bf2:Work .
  ?subWork bf2:partOf ?work .
  ?work bf2:title/rdfs:label ?workTitle .
    MINUS  {?work bf2:partOf ?uberWork}
  }
  LIMIT 100
PROVA LA QUERY

Quali sono i ruoli più frequenti tra gli autori secondari delle opere?

PREFIX bf2: <http://id.loc.gov/ontologies/bibframe/>
PREFIX bflc: <http://id.loc.gov/ontologies/bflc/>

select ?personRole COUNT (distinct ?work) as ?count where {
  ?work bf2:contribution ?contribution .
  MINUS {?contribution a bflc:PrimaryContribution} .
  ?contribution bf2:agent ?personURI .
  ?contribution bf2:role/rdfs:label ?personRole .
}
GROUP BY ?personRole
ORDER BY DESC (?count)
PROVA LA QUERY

Quali sono le tipologie di istanze più frequenti?

PREFIX cobis: <http://dati.cobis.to.it/vocab/>

select ?bookType (count(?instance) as ?count) where {
  ?instance cobis:bookType/rdfs:label ?bookType
}
GROUP BY ?bookType
ORDER BY  DESC(?count)
PROVA LA QUERY

Quali sono i soggetti delle opere del CoBiS?

PREFIX bf2: <http://id.loc.gov/ontologies/bibframe/>

select ?subject (count(?instance) as ?count) where {
  ?instance bf2:subject ?subject
}
GROUP BY ?subject
ORDER BY  DESC(?count)
PROVA LA QUERY

Qual è la cronologia recente delle opere suddivisa per biblioteca?

PREFIX bf2: <http://id.loc.gov/ontologies/bibframe/>
PREFIX cobis: <http://dati.cobis.to.it/vocab/>

SELECT ?date ?biblio count (?instance as ?count)
WHERE {
 ?instance cobis:dataNormalizzata ?datePublished .
 BIND(REPLACE (?datePublished, "\\D", "") as ?date) .
 FILTER (xsd:integer(?date) > 1799)
 FILTER (xsd:integer(?date) < 2020)
 ?instance bf2:hasItem ?item .
 ?item bf2:heldBy ?biblio
}
ORDER BY ?date
PROVA LA QUERY

Naviga tra gli autori delle opere delle CoBiS

ESPLORA