Når du søker i Oria får du treff på poster fra to indekser eller «databaser»:
• En «lokalindeks» som inneholder poster fra Alma og fra andre søkekilder Unit/BIBSYS høster direkte, som for eksempel Brage
• PCI (Primo Central Index), som styres utelukkende av Ex Libris mtp hvilke kilder høstes og hvor ofte.
Postene i begge disse indeksene går gjennom de samme prosessene, som for eksempel indeksering, normalisering og FRBRisering (gruppering av like poster). Alle postene som høstes blir konvertert til samme format, PNX (Primo Normalized XML), noe som gjør det lettere å sammenligne dem, og finne dubletter. Om det høstes flere metadataposter om samme dokument inn i PCI, vil systemet klare å presentere én samlet post i de fleste tilfellene. At det likevel oppstår dubletter kan skyldes lav metadatakvalitet, og forskjeller mellom postene. Dette gjelder også forskjeller mellom deler av PNXen som ikke er synlig for brukeren. For mer informasjon om PNXen, klikk her.
Disse prosessene skjer kun innenfor hver indeks, noe som kan være en annen grunn til at dubletter oppstår: poster som ligger i PCI kan ikke grupperes med poster fra lokalindeksen.
De fleste elektroniske ressurser, som artikler, har kun post i PCI, slik at systemet som oftest klarer å gruppere poster og vise bare én post for hvert dokument. Men e-bøker er en type elektronisk ressurs som kan være representert både i Alma, det vil si i lokalindeksen, og i andre databaser som høstes inn i PCI.
For mer informasjon om PCI og forholdet mellom søkekilder i PCI og samlinger i Alma, sjekk presentasjonen fra BIBSYS-konferansen PCI – Hva er greia?.