Projekti

Yleinen

Profile

Indeksointitarpeet

Elasticsearching mappings.yaml -tiedosto sivun liitteissä. Johanna lisännyt 27.1.2021 mappingsTati.yaml tiedoston, missä testi-Tätin määritykset.

Indeksointityöryhmän palaverit

Lista indeksointitarpeista

MARC-kenttä Tarvitaan Elasticiin yleisillä Tarvitaan Elasticiin tieteellisillä Huomautus Tarvitaan uusi indeksi Tarvitaan alias Tarvitaan valikkoon Liittyvä tiketti
041k - välikäännöksen kieli kyllä löytyy language-intermediate-translation -indeksistä eli haettavissa, tarvitaan alias ei kyllä: lit kyllä
041j - tekstityksen kieli kyllä Tarvitaanko valikkoon? ei ei
041a - tekstin kieli kyllä
041d - puhuttu/laulettu kieli kyllä ei ei kyllä
041h - alkukieli kyllä Löytyy indeksistä language-original. Ongelma: ei alasvetovalikkoa, pitää osata hakea "language-original:eng" ja muistaa kielikoodit ei ei kyllä
041e - libreton kieli kyllä Harvemmin edes luetteloidaan tieto tähän kenttään, vähän käytetty hauissa. Ei indeksoida. ei? ei? ei?
041f - sisällysluettelon kieli kyllä Pohdittava tarpeellisuus, vähän käytetty hauissa. Ei indeksoida. ei? ei? ei?
041g - liiteaineiston kieli kyllä Pohdittava tarpeellisuus, vähän käytetty hauissa. Ei indeksoida. Voidaan miettiä uudelleen myöhemmin, jos tarvetta ilmenee. ei? ei? ei?
041i - välitekstien kieli Pohdittava tarpeellisuus, vähän käytetty hauissa. Ei indeksoida. ei? ei? ei?
041p - kuulovammaisille tarkoitetun tekstityksen kieli Saavutettavuus-näkökulma, pohditaan vielä. Tehdään uusi indeksi ln-captions
041r - visuaalinen kieli (ei teksti) Pohdittava, saavutettavuus-näkökulma. Tehdään uusi indeksi ln-visual
041q Pohdittava, saavutettavuus-näkökulma. Tehdään uusi indeksi ln-acaudio
041t Pohdittava, saavutettavuus-näkökulma. Tehdän uusi indeksi ln-transcript
042a kyllä Fennica- ja Viola-tietueet saavat tunnuksen, tarve Kansalliskirjastolla
049c - Ikäraja kyllä kyllä Indeksoidaan agelevel-indeksiin. Fasetiksi?/AÖ ei kyllä #4163 ja #594
080x - UDK-lisäluokka kyllä indeksoitu jo udc-aux-subdivision ei kyllä ei?
084a - YKL-luokitus kyllä kyllä ODOTTAA HYVÄKSYNTÄÄ githubissa. kokeiltu lisätä other-classification-indeksi OUTIn testillä Elasticiin: Tarvii oman indeksin ja aliaksen, myös valikoihin. Huomioidaan toistumat. kyllä: other-classification kyllä: oc kyllä #4143
245b Löytyy title-indeksistä viimeisimmän päivityksen jälkeen
245c Tarvitseekö tekijähaun etsiä tästä vastuullisuusmerkinnät-kentästä, vai onko kaikki tieto myös muualla (100a, 110a, 111a, 700a, 710a jne.)/ KS - tiputetaan pois author-indeksistä - Tämä oli vielä mukana author-indeksissä/AÖ Esimerkkitietue
245p - osan nimi / AV. Kannatan/KA - tullut mukaan tieteellisten päivityksessä
257a - tuottajan maa / AV. Hyödyllinen lisä/KA - lisätään place-of-origin-indeksiin
264a kyllä Publisher location pitää kohdistaa tähän ja kenttään 260a - löytyy place-of-publication-indeksistä
264b kyllä Publisher-kenttä pitää kohdistaa tähän ja kenttään 260b - löytyy jo publisher-indeksistä
264c kyllä Publication date pitää kohdistaa tähän ja kenttään 260c - löytyy kumpikin date-of-publication-indeksistä nyt
300 kyllä kyllä Löytyy extent-indeksistä ei ei
336a, 337a ja 338a Toive tuli Kansalliskirjastosta. Pohdittiin kuitenkin, onko näille oikeasti tarvetta, koska kyseessä on koneluettevaksi tarkoitettuja kenttiä. Satu selvittää.
341abcde kyllä kyllä Ei löydy mistään, eikä sovellu mihinkään nykyisistä indekseistä. Tehdään uusi indeksi nimeltään accessibility-content kyllä: accessibility-content ei ei?
347b kyllä kyllä Ei löydy mistään indeksistä, tarvitaan, jotta voidaan hakea esim. Daisy-äänikirjoja. Tehdään uusi indeksin encoding-format kyllä: encoding-format ei ei
348a kyllä kyllä Löytyy notated-music-format-term-indeksistä ei kyllä: nmft ei?
370g kyllä kyllä Löytyy place-of-origin-indeksistä ei ei ei
382abdpv kyllä kyllä Löytyvät indekseistä ei ei ei
383abce kyllä kyllä Löytyvät indekseistä ei ei ei
385a kyllä Tehdään uusi audience-term-indeksi kyllä: audience-term ei ei
386a kyllä Tehdään uusi creator-term-indeksi kyllä: creator-term ei ei
388a kyllä kyllä Löytyy time-of-period-indeksistä ei ei ei
500a - Huomautus kyllä kyllä Löytyy note-indeksistä ei ei ei
502abc Löytyy dissertation-information-indeksistä ei ei ei
505agrt Löytyy note-indeksistä ei ei ei
506af Kummallekin oma indeksi olemassa ei ei ei
538a Löytyy system-detail-note-indeksistä ei ei ei
540c kyllä Ei löydy mistään, tehdään uusi indkesi terms-governing-use-and-reproduction kyllä: terms-of-governing-use-and-reproduction kyllä: tgur ei
561a - Huomautus omistushistoriasta Kyllä löytyy: ownership-history ei ei ei #3883
567b kyllä Löytyy methodoly-controlled-term-indeksistä ei ei ei
586a kyllä Löytyy awards-note-indeksistä ei ei ei
588a kyllä Löytyy description-source-note-indeksistä ei ei ei
590a - Kirjastokohtainen huomautuskenttä kyllä Kyllä 590 kokonaisuudessan note-indeksissä - Hellessä käytössä / Myös Lapin kirjastossa/TS
594a - Kirjastokohtainen huomautuskenttä kyllä Fennican huomautuskenttä - lisätään note-indeksiin
598a - Kirjastokohtainen huomautuskenttä Kyllä Tritoniassa kurssikirjatiedot - lisätään note-indeksiin
599a - Kirjastokohtainen huomautuskenttä Kyllä Kyllä 3AMK-kirjastoissa x-alkuisia huomautuksia eri aineistoille, esim. xkauppakamari. / Yleisistä kirjastoista ainakin Lapin kirjasto käyttää (Lapponica-tietokanta- ja saamelaisbibliografiamerkintöihin)/TS - lisätään note-indeksiin
610b - yhteisön nimi aiheena - alayksikkö kyllä Löytyy name ja corporate-name -indekseistä. kw-haussa mukana. Lisätään subject-indeksiin ei ei ei
630a - yhtenäistetty nimeke kyllä Lisätään subject-indeksiin. / AV. Kyllä/KA ei ei ei
630p - teoksen osan nimeke kyllä Lisätään subject-indeksiin. / AV. Kyllä/KA ei ei ei
648a - aikaa ilmaiseva termi kyllä Lisätään subject-indeksiin. / AV ei ei ei
650z kyllä Lisätään su-geo-indeksiin ei ei ei
655a - genre kyllä kyllä Löytyy index-term-genre-indeksistä. - Yleisissä kirjastoissa YSO-konversio tekemättä, joten tarvitaan myös xyz ei ei ei
655x kyllä Lisätään index-term-genre-indeksiin. Voidaan poistaa, kun YSO-konversio tehty ei ei ei
655y kyllä Lisätään time-period-indeksiin. Voidaan poistaa, kun YSO-konversio tehty ei ei ei
655z kyllä Lisätään place-of-origin-indeksiin. Voidaan poistaa, kun YSO-konversio tehty ei ei ei
765$t - alkukielisen julkaisun nimeke Selvitetään, mistä tarve tullut ja lisätään sitten, jos tarpeen.
767$t - ei-alkukielisen julkaisun nimeke Selvitetään, mistä tarve tullut ja lisätään sitten, jos tarpeen.
800t - sarjalisäkirjaus, henkiönimi- nimeke kyllä Lisätään title-series-indeksiin ei ei ei
830a - sarjalisäkirjaus, yhtenäistetty nimeke kyllä Lisätään title, title-series, title-uniform -indekseihin ei ei ei
830n - sarjalisäkirjaus, numero kyllä kyllä Lisätään title, title-series, title-uniform ei ei ei
830p - sarjalisäkirjaus, osan nimeke kyllä kyllä Lisätään title, title-series, title-uniform ei ei ei
830v - sarjalisäkirjaus, sarjan sisäinen numerointi kyllä kyllä Lisätään title, title-series, title-uniform ei ei ei
830x - sarjalisäkirjaus - issn kyllä kyllä Lisätään issn-indeksiin ei ei ei
852h - Paikkamerkin hyllyluokka kyllä kyllä Tieteellisillä tarve saada sijaintihaku toimimaan kausijulkaisuissa ja monografioissa Ks. myös 852i Tämä kenttä voi ilmeisesti olla varasto- tai bib-tietueessa. Myös katkaisuhaku tähän kenttään on tarpeen. -> Tehdään uusi indeksi placement kyllä: placement ei ei #4143
852i - Kappaletta koskevat tiedot kyllä Sijaintihaku kausijulkaisuihin ja monoihin (852 h ja i) Tämä kenttä voi ilmeisesti olla varasto- tai bib-tietueessa. Löytyy location-item-part-indeksistä ei ei ei
866 - Vapaamuotoiset varastotiedot ei kyllä -> koskee vain varastotietoja, ei oteta nyt mukaan, koska indeksointi ei yllä varastotietueisiin vielä. Huomautushaku sanahakuna
952S - hyllytarkenne kyllä kyllä Lisätään uusi sublocation-indeksi, Johanna tutkii, osaako Elastic erotella ison ja pienen kirjaimen, koska 952s on viimeksi lainattu -tieto niteessä kyllä: sublocation ei? ei?
935a Satu selvittää, onko tälle tarvetta -> ei tarvetta
900a - Viitaus henkilön nimi kyllä Lisätään author-indeksiin, koska auktoriteettitietueet eivät ole ajantasaiset. Voidaan poistaa indeksistä, kun auktoriteetit saadaan toimimaan oikein ei ei ei
910a - Viitaus yhteisön nimi kyllä Lisätään author-indeksiin, koska auktoriteettitietueet eivät ole ajantasaiset. Voidaan poistaa indeksistä, kun auktoriteetit saadaan toimimaan oikein ei ei ei
911a - Viittaus kokouksen nimi kyllä Lisätään author-indeksiin, koska auktoriteettitietueet eivät ole ajantasaiset. Voidaan poistaa indeksistä, kun auktoriteetit saadaan toimimaan oikein ei ei ei
Muita huomioita
  • corporate-name-indeksiin määritetty 411, 611, 711, 811 -kentistä kaikki osakentät. Onko tämä tarpeen vai riittäisikö vain osa osakentistä? Anna ja Antti testaa vähäsen.
  • mikä on editor-indeksin tarkoitus? Sinne menee 100a ja 700-kentät? Tällä hetkellä se tuntuu tarpeettomalta.
  • name-and-title-indeksiin kaikkiin kenttiin at-osakentät

Testaushuomioita 29.4.2021

  • uudet indeksien lyhenteet eivät toimi, koska niitä ei saada määritettyä nykyisessä Koha-versiossa.
  • sublocation nimetään uudelleen subloc-indeksiksi, jotta se saadaan toimimaan myös tarkan haun Muita vaihtoehtoja -välilehdellä (ks. 1. kohta) /AÖ
  • only-host-items ja only-component-parts-indeksit puuttuu? Vai toimiiko emo- ja osakohteiden haku jotenkin toisella tavalla? Toimiiko tieteellisillä? /AÖ
    • tieteellisillä ei ole emo/osakohderajausta ollenkaan
    • Johanna tutkii tätä lisää
  • location-indeksi nimetään loc-indeksiksi, jotta tarkan haun hyllypaikka-rajaus toimii. (ks. 1. kohta) /AÖ
  • 245c mukana vielä author-indeksissä /AÖ -> poistetaan
  • 245p osan nimi - ei ollut mukana tietellisten mappingsissä. Lisätään title-indeksiin, jos ei saada tieteellisiltä.
  • 245n eli osan numero, lisätään title-indeksiin
  • 648a - kirjoitusvirhe koontiexcelissä, korjataan.
  • 610b - jäänyt pois, lisätään.
  • 336a, 337a, 338a tarvitaan Kansalliskirjastossa. Löytyvät jo indeksistä.
  • 711t -> name-and-title (a:n lisäksi)
  • kenttien toistumat eivät indeksoidu, eli esim. jos useampi kielikoodi, niin vain ensimmäinen merkintä indeksoituu. Anna testaa vielä.
    • tähän paljastui syyksi se, että ln-indeksiin on indeksoitu vain 008:n merkkipaikat 35-37
    • ln-indeksiin lisätään 041a ja 041d, jolloin myös toistumat voidaan hakea ln-haulla
  • ln-audio-indeksiin lisätään 041d
  • muutetaan interest-age-level-indeksin nimeksi agelevel

Valikot ja niiden säädöt

Kieli
  • koitetaan saada yhteisöön läpi useampia kieli-indeksejä valittaviksi
  • jos yhteisöä ei kiinnosta ollenkaan, koitetaan luoda javascriptillä valikot lennossa, jotta ei tarvitse tehdä muutoksia Kohan koodiin.
Ikärajat
  • lisätään auktorisoitu arvo ikärajoille ja lisätään se AdvancedSearchTypes -järjestelmäasetukseen ja javascripitillä nimetään välilehti oikeaksi
Luokitus
  • yritetään lisätä valikkoon other-classification YKL-luokitus -nimellä javascriptillä
  • yritetään lisätä valikkoon udc-classification UDC-luokitus -nimellä javascriptillä
bib-level
  • yritetään lisätä javascriptillä subtype-valikkoon
    • bib-level:i nimellä Päivittyvä julkaisu
    • bib-level:s nimellä Kausijulkaisu

Tarkan haun valikkojen muokkaukset


Testaushuomioita 30.4. jälkeen

  • 710 ei ole author-name-corporate -indeksissä, pitäisikö olla? AÖ -> lisätään 710
  • author-name-personal-indeksissä on 400, miksi? AÖ -> auktoriteettikenttä henkilönnimi
  • author-indeksissä ei ole 400a, 710a, 711a, 800a, 810a, 811a. AÖ -> lisätään author-indeksiin
  • author-title-indeksissä on 400t, 410t, 411t, miksi? Tuollaisia ei ole olemassa marcissa. AÖ
  • 015 indeksoitu bfg-number- ja bnb-card-number -indekseihin, onko tarpeen? AÖ -> otetaan 015 pois bgf-number, bnb-card-number ja number-db-indekseistä.
  • conference-name-indeksissa 411? Tuollaista ei ole olemassa marcissa. AÖ
  • corporate-name-indeksissä 410? AÖ
  • ff-alkuiset-indeksit.. mitä ihmettä? 007/02 on "määrittelemätön", mitä hyötyä tuollaisesta on? AÖ -> tutkitaan lisää
  • 648a-kenttä puuttuu -> lisätään
  • 655a ja 655x -> lisätään subject-indeksiin
  • ln -> lisätään 041j

Seuraavat kentät lisätty jo Kohaan mutta odottaa tieteellisillä Kohan päivitystä:
  • 041p
  • 022z
  • 022y
  • 020z
  • 084a

Mallirivi- MARC-kenttä
Muut tarpeet Puuttuu Zebrasta Tarvitaan Elasticiin yleisillä Tarvitaan Elasticiin tieteellisillä Huomautus Liittyvä tiketti
Relevanssilajittelu ei käytännössä toimi, osumilla eri kenttiin ei ole mitään painotuksia Kyllä #3883
Keyword-hakuja, jotka kohdistuvat kaikkeen tietueessa olevaan dataan (esim. soitinnus, huomautuskentät 5xx) kyllä kyllä
Lehden nimellä haku: haku on pystyttävä rajaamaan vain kausijulkaisuihin, eli niihin, joilla LDR/07= i tai s kyllä LDR/07 löytyy bib-level-indeksistä