Projekti

Yleinen

Profile

Tukipyyntö #5006

Lappi : emo-osakohdelinkityksen ongelmissa mahdollisesti syynä systemaattinen virhe osakohteen 773w-kentässä

Lisännyt Leena Kinnunen yli vuosi sitten. Päivitetty noin kuukausi sitten.

Tila:
Ratkaisu ehdotettu
Prioriteetti:
Normaali
Nimetty:
-
Luokka:
-
Kohdeversio:
-
Alku:
2. Syyskuuta 2021
Määräaika:
% Tehty:

0%

Arvioitu aika:
Yhteyshenkilö:
Votes: 0

Kuvaus

Lapissa on paljon osakohteita, joiden linkitys emotietueeseen ei toimi, koska osakohteen kentässä 773w on jotain muuta kuin emon kontrollinumero. Näissä on tosi paljon kaikenlaisia numero- ja kirjainsarjoja, jotka liittyvät emotietueeseen: levyn julkaisutunnuksia, nuottikokoelmien ISBN-numeroita yms.

Käyttäjä on tehnyt selvitystä, missä hän on havainnut ison joukon osakohteita, joissa on samalla tavalla muodostunut virheellinen 773w. Virheellinen kontrollinumero koostuu merkeistä "pl00" + emon kontrollinumero.

Esim: osakohde:
https://virkailija.lapinkirjasto.fi/cgi-bin/koha/catalogue/MARCdetail.pl?biblionumber=509112&searchid=scs_1630402211838
773w: pl00326380

Osakohteen emo:
https://virkailija.lapinkirjasto.fi/cgi-bin/koha/catalogue/MARCdetail.pl?biblionumber=506849&searchid=scs_1630402136894
Kontrollinumero: 326380

Tällaisia osakohteita, joissa on tismalleen sama väärä osuus ennen oikeaa kontrollinumeroa on noin 43000. Olisikohan näitä mahdollista korjata jollain ajolla?

Hakutulos "pl00":
https://virkailija.lapinkirjasto.fi/cgi-bin/koha/catalogue/search.pl?idx=kw&q=pl00&offset=0&sort_by=pubdate_dsc

Aivan varma tuosta luvusta ei voi olla, joten mukana saattaa olla myös sellaisia tietueita, joissa "pl00" esiintyy jossain toisessakin hakukelpoisessa kentässä.

Käytäjä on poistanut osakohteiden 773w-kentästä tuon merkinnän p100, jonka jälkeen emo-osakohde-linkitys on alkanut toimimaan.

Pystyttekö tarkistamaan, kuinka paljon näitä p100-tietoja voisi osakohteiden kentissä 773w olla? Voisiko ne poistaa tietokanta-ajolla?

Historia

#1 Updated by Kodo Korkalo yli vuosi ago

  • Nimetty set to Pasi Kallinen

Pyydän Kallisen Pasia tutkimaan tätä.

#2 Updated by Pasi Kallinen yli vuosi ago

Näyttäis siltä et ei oo pelkästään "pl00", vaan voi olla noita nollia enemmänkin, esim. "pl000" kuten biblioissa 18797 ja 18798.

Kyseessä siis (konversiossa?) kenttään laitettu "pl" + tietuenumero pidennettynä kahdeksaan merkkiin etunollilla.

w-osakenttiä joissa on tuo pl0-etuliite on 43499 kpl. Väsään skriptin millä korjataan nuo.

#3 Updated by Pasi Kallinen yli vuosi ago

  • Tila changed from Uusi to Työn alla

#4 Updated by Pasi Kallinen yli vuosi ago

  • Luokka deleted (Luettelointi)
  • Tila changed from Työn alla to Ratkaisu ehdotettu
  • Nimetty deleted (Pasi Kallinen)
  • Yhteyshenkilö deleted (Leena Kinnunen)

Muutos ajettu tuotantoon, kaikista 773w kentistä poistettiin alusta "pl" ja alkunollat. Kohan hakukoneeseen tiedot vielä päivittymässä, mutta suurin osa pitäisi niistä jo näkyä haettaessa.

Osakohteetkin näkyvät nyt oikein, koska ne perustuvat noihin 773w-kenttiin, esim. https://virkailija.lapinkirjasto.fi/cgi-bin/koha/catalogue/detail.pl?biblionumber=15463

#5 Updated by Leena Kinnunen yli vuosi ago

Oivalista Pasi! Ja heti mietimme lisää: onko mahdollista tarkistaa ja listata tietuenumerot, jotka sisältävät kirjaimia? Jos löytyisi muitakin systemaattisia virheitä? Virkalija oli myös havainnut todella pitkiä tietuenumeroita (esim. isbn-numeroita). Onko tietuenumerolla jotain maksimipituutta, ja pystyisikö myös tätä pidemmät tietuenumerot etsimään, voisiko niissä olla systemaattisuutta?

#6 Updated by Anneli Österman noin kuukausi ago

Leena, jos tuo viimeisimmän kommentin kysymys on vielä ajankohtainen, niin teetkö siitä uuden tiketin GitHubiin ja sulje sitten tämä tiketti. :)

Vie Atom PDF