Projekti

Yleinen

Profile

Indeksointitarpeet

Elasticsearching mappings.yaml -tiedosto sivun liitteissä. Johanna lisännyt 27.1.2021 mappingsTati.yaml tiedoston, missä testi-Tätin määritykset.

Indeksointityöryhmän palaverit

Lista indeksointitarpeista

Tämä taulukko on indeksointityöryhmän työversio, eikä sisällä kirjausta kaikista olemassa olevista indekseistä. Täydellinen lista indekseistä ja mäppäyksistä.

MARC-kenttä Tarvitaan Elasticiin yleisillä Tarvitaan Elasticiin tieteellisillä Huomautus Tarvitaan uusi indeksi Tarvitaan alias Tarvitaan valikkoon Liittyvä tiketti
041k - välikäännöksen kieli kyllä löytyy language-intermediate-translation -indeksistä eli haettavissa, tarvitaan alias ei kyllä: lit kyllä
041j - tekstityksen kieli kyllä Tarvitaanko valikkoon? ei ei
041a - tekstin kieli kyllä
041d - puhuttu/laulettu kieli kyllä ei ei kyllä
041h - alkukieli kyllä Löytyy indeksistä language-original. Ongelma: ei alasvetovalikkoa, pitää osata hakea "language-original:eng" ja muistaa kielikoodit ei ei kyllä
041e - libreton kieli ei Harvemmin edes luetteloidaan tieto tähän kenttään, vähän käytetty hauissa. Ei indeksoida. ei? ei? ei?
041f - sisällysluettelon kieli ei Pohdittava tarpeellisuus, vähän käytetty hauissa. Ei indeksoida. ei? ei? ei?
041g - liiteaineiston kieli ei Pohdittava tarpeellisuus, vähän käytetty hauissa. Ei indeksoida. Voidaan miettiä uudelleen myöhemmin, jos tarvetta ilmenee. ei? ei? ei?
041i - välitekstien kieli ei Pohdittava tarpeellisuus, vähän käytetty hauissa. Ei indeksoida. ei? ei? ei?
041p - kuulovammaisille tarkoitetun tekstityksen kieli kyllä Saavutettavuus-näkökulma, pohditaan vielä. Tehdään uusi indeksi ln-captions
041r - visuaalinen kieli (ei teksti) kyllä Pohdittava, saavutettavuus-näkökulma. Tehdään uusi indeksi ln-visual
041q kyllä Pohdittava, saavutettavuus-näkökulma. Tehdään uusi indeksi ln-acaudio
041t kyllä Pohdittava, saavutettavuus-näkökulma. Tehdän uusi indeksi ln-transcript
042a kyllä Fennica- ja Viola-tietueet saavat tunnuksen, tarve Kansalliskirjastolla
049c - Ikäraja kyllä kyllä Indeksoidaan agelevel-indeksiin. Fasetiksi?/AÖ ei kyllä #4163 ja #594
080x - UDK-lisäluokka kyllä indeksoitu jo udc-aux-subdivision ei kyllä ei?
084a - YKL-luokitus kyllä kyllä ODOTTAA HYVÄKSYNTÄÄ githubissa. kokeiltu lisätä other-classification-indeksi OUTIn testillä Elasticiin: Tarvii oman indeksin ja aliaksen, myös valikoihin. Huomioidaan toistumat. kyllä: other-classification kyllä: oc kyllä #4143
245b Löytyy title-indeksistä viimeisimmän päivityksen jälkeen
245c Tarvitseekö tekijähaun etsiä tästä vastuullisuusmerkinnät-kentästä, vai onko kaikki tieto myös muualla (100a, 110a, 111a, 700a, 710a jne.)/ KS - tiputetaan pois author-indeksistä - Tämä oli vielä mukana author-indeksissä/AÖ Esimerkkitietue
245p - osan nimi kyllä / AV. Kannatan/KA - tullut mukaan tieteellisten päivityksessä
257a - tuottajan maa / AV. Hyödyllinen lisä/KA - lisätään place-of-origin-indeksiin
264a kyllä Publisher location pitää kohdistaa tähän ja kenttään 260a - löytyy place-of-publication-indeksistä
264b kyllä Publisher-kenttä pitää kohdistaa tähän ja kenttään 260b - löytyy jo publisher-indeksistä
264c kyllä Publication date pitää kohdistaa tähän ja kenttään 260c - löytyy kumpikin date-of-publication-indeksistä nyt
300 kyllä kyllä Löytyy extent-indeksistä ei ei
336a, 337a ja 338a kyllä Toive tuli Kansalliskirjastosta. Pohdittiin kuitenkin, onko näille oikeasti tarvetta, koska kyseessä on koneluettevaksi tarkoitettuja kenttiä. Satu selvittää. ---> Ovat jo indekseissä content-type-term, media-type-term, carrier-type-term
341abcde kyllä kyllä Ei löydy mistään, eikä sovellu mihinkään nykyisistä indekseistä. Tehdään uusi indeksi nimeltään accessibility-content kyllä: accessibility-content ei ei?
347b kyllä kyllä Ei löydy mistään indeksistä, tarvitaan, jotta voidaan hakea esim. Daisy-äänikirjoja. Tehdään uusi indeksin encoding-format kyllä: encoding-format ei ei
348a kyllä kyllä Löytyy notated-music-format-term-indeksistä ei kyllä: nmft ei?
370g kyllä kyllä Löytyy place-of-origin-indeksistä ei ei ei
382abdpv kyllä kyllä Löytyvät indekseistä ei ei ei
383abce kyllä kyllä Löytyvät indekseistä ei ei ei
385a kyllä kyllä Tehdään uusi audience-term-indeksi kyllä: audience-term ei ei
386a kyllä kyllä Tehdään uusi creator-term-indeksi kyllä: creator-term ei ei
388a kyllä kyllä Löytyy time-of-period-indeksistä ei ei ei
500a - Huomautus kyllä kyllä Löytyy note-indeksistä ei ei ei
502abc Löytyy dissertation-information-indeksistä ei ei ei
505agrt Löytyy note-indeksistä ei ei ei
506af Kummallekin oma indeksi olemassa ei ei ei
538a Löytyy system-detail-note-indeksistä ei ei ei
540c kyllä Ei löydy mistään, tehdään uusi indkesi terms-governing-use-and-reproduction kyllä: terms-of-governing-use-and-reproduction kyllä: tgur ei
561a - Huomautus omistushistoriasta Kyllä löytyy: ownership-history ei ei ei #3883
567b kyllä Löytyy methodoly-controlled-term-indeksistä ei ei ei
586a kyllä Löytyy awards-note-indeksistä ei ei ei
588a kyllä Löytyy description-source-note-indeksistä ei ei ei
590a - Kirjastokohtainen huomautuskenttä kyllä Kyllä 590 kokonaisuudessan note-indeksissä - Hellessä käytössä / Myös Lapin kirjastossa/TS
594a - Kirjastokohtainen huomautuskenttä kyllä Fennican huomautuskenttä - lisätään note-indeksiin
598a - Kirjastokohtainen huomautuskenttä Kyllä Tritoniassa kurssikirjatiedot - lisätään note-indeksiin
599a - Kirjastokohtainen huomautuskenttä Kyllä Kyllä 3AMK-kirjastoissa x-alkuisia huomautuksia eri aineistoille, esim. xkauppakamari. / Yleisistä kirjastoista ainakin Lapin kirjasto käyttää (Lapponica-tietokanta- ja saamelaisbibliografiamerkintöihin)/TS - lisätään note-indeksiin
610b - yhteisön nimi aiheena - alayksikkö kyllä kyllä Löytyy name ja corporate-name -indekseistä. kw-haussa mukana. Lisätään subject-indeksiin ei ei ei
630a - yhtenäistetty nimeke kyllä kyllä Lisätään subject-indeksiin. / AV. Kyllä/KA ei ei ei
630p - teoksen osan nimeke kyllä kyllä Lisätään subject-indeksiin. / AV. Kyllä/KA ei ei ei
648a - aikaa ilmaiseva termi kyllä kyllä Lisätään subject-indeksiin. / AV ei ei ei
650z kyllä kyllä Lisätään su-geo-indeksiin ei ei ei
655a - genre kyllä kyllä Löytyy index-term-genre-indeksistä. - Yleisissä kirjastoissa YSO-konversio tekemättä, joten tarvitaan myös xyz ei ei ei
655x kyllä kyllä Lisätään index-term-genre-indeksiin. Voidaan poistaa, kun YSO-konversio tehty ei ei ei
655y kyllä kyllä Lisätään time-period-indeksiin. Voidaan poistaa, kun YSO-konversio tehty ei ei ei
655z kyllä kyllä Lisätään place-of-origin-indeksiin. Voidaan poistaa, kun YSO-konversio tehty ei ei ei
765$t - alkukielisen julkaisun nimeke Selvitetään, mistä tarve tullut ja lisätään sitten, jos tarpeen.
767$t - ei-alkukielisen julkaisun nimeke Selvitetään, mistä tarve tullut ja lisätään sitten, jos tarpeen.
800t - sarjalisäkirjaus, henkiönimi- nimeke kyllä kyllä Lisätään title-series-indeksiin ei ei ei
830a - sarjalisäkirjaus, yhtenäistetty nimeke kyllä kyllä Lisätään title, title-series, title-uniform -indekseihin ei ei ei
830n - sarjalisäkirjaus, numero kyllä kyllä Lisätään title, title-series, title-uniform ei ei ei
830p - sarjalisäkirjaus, osan nimeke kyllä kyllä Lisätään title, title-series, title-uniform ei ei ei
830v - sarjalisäkirjaus, sarjan sisäinen numerointi kyllä kyllä Lisätään title, title-series, title-uniform ei ei ei
830x - sarjalisäkirjaus - issn kyllä kyllä Lisätään issn-indeksiin ei ei ei
852h - Paikkamerkin hyllyluokka kyllä kyllä Tieteellisillä tarve saada sijaintihaku toimimaan kausijulkaisuissa ja monografioissa Ks. myös 852i Tämä kenttä voi ilmeisesti olla varasto- tai bib-tietueessa. Myös katkaisuhaku tähän kenttään on tarpeen. -> Tehdään uusi indeksi placement kyllä: placement ei ei #4143
852i - Kappaletta koskevat tiedot kyllä Sijaintihaku kausijulkaisuihin ja monoihin (852 h ja i) Tämä kenttä voi ilmeisesti olla varasto- tai bib-tietueessa. Löytyy location-item-part-indeksistä ei ei ei
866 - Vapaamuotoiset varastotiedot ei kyllä -> koskee vain varastotietoja, ei oteta nyt mukaan, koska indeksointi ei yllä varastotietueisiin vielä. Huomautushaku sanahakuna
952S - hyllytarkenne kyllä ei Lisätään uusi sublocation-indeksi, Johanna tutkii, osaako Elastic erotella ison ja pienen kirjaimen, koska 952s on viimeksi lainattu -tieto niteessä. Ei indeksoida tieteellisille, aikaisempi rasti virheellinen /JK kyllä: sublocation ei? ei?
935a Satu selvittää, onko tälle tarvetta -> ei tarvetta
900a - Viitaus henkilön nimi kyllä kyllä Lisätään author-indeksiin, koska auktoriteettitietueet eivät ole ajantasaiset. Voidaan poistaa indeksistä, kun auktoriteetit saadaan toimimaan oikein ei ei ei
910a - Viitaus yhteisön nimi kyllä kyllä Lisätään author-indeksiin, koska auktoriteettitietueet eivät ole ajantasaiset. Voidaan poistaa indeksistä, kun auktoriteetit saadaan toimimaan oikein ei ei ei
911a - Viittaus kokouksen nimi kyllä kyllä Lisätään author-indeksiin, koska auktoriteettitietueet eivät ole ajantasaiset. Voidaan poistaa indeksistä, kun auktoriteetit saadaan toimimaan oikein ei ei ei
960a - Kokoelma ei kyllä Fennican käyttämä kenttä, sis. esim. saamelaisbibliografian tiedot kyllä: collection-960
Muita huomioita
  • corporate-name-indeksiin määritetty 411, 611, 711, 811 -kentistä kaikki osakentät. Onko tämä tarpeen vai riittäisikö vain osa osakentistä? Anna ja Antti testaa vähäsen.
  • mikä on editor-indeksin tarkoitus? Sinne menee 100a ja 700-kentät? Tällä hetkellä se tuntuu tarpeettomalta.
  • name-and-title-indeksiin kaikkiin kenttiin at-osakentät

Testaushuomioita 29.4.2021

  • uudet indeksien lyhenteet eivät toimi, koska niitä ei saada määritettyä nykyisessä Koha-versiossa.
  • sublocation nimetään uudelleen subloc-indeksiksi, jotta se saadaan toimimaan myös tarkan haun Muita vaihtoehtoja -välilehdellä (ks. 1. kohta) /AÖ
  • only-host-items ja only-component-parts-indeksit puuttuu? Vai toimiiko emo- ja osakohteiden haku jotenkin toisella tavalla? Toimiiko tieteellisillä? /AÖ
    • tieteellisillä ei ole emo/osakohderajausta ollenkaan
    • Johanna tutkii tätä lisää
  • location-indeksi nimetään loc-indeksiksi, jotta tarkan haun hyllypaikka-rajaus toimii. (ks. 1. kohta) /AÖ
  • 245c mukana vielä author-indeksissä /AÖ -> poistetaan
  • 245p osan nimi - ei ollut mukana tietellisten mappingsissä. Lisätään title-indeksiin, jos ei saada tieteellisiltä.
  • 245n eli osan numero, lisätään title-indeksiin
  • 648a - kirjoitusvirhe koontiexcelissä, korjataan.
  • 610b - jäänyt pois, lisätään.
  • 336a, 337a, 338a tarvitaan Kansalliskirjastossa. Löytyvät jo indeksistä.
  • 711t -> name-and-title (a:n lisäksi)
  • kenttien toistumat eivät indeksoidu, eli esim. jos useampi kielikoodi, niin vain ensimmäinen merkintä indeksoituu. Anna testaa vielä.
    • tähän paljastui syyksi se, että ln-indeksiin on indeksoitu vain 008:n merkkipaikat 35-37
    • ln-indeksiin lisätään 041a ja 041d, jolloin myös toistumat voidaan hakea ln-haulla
  • ln-audio-indeksiin lisätään 041d
  • muutetaan interest-age-level-indeksin nimeksi agelevel

Valikot ja niiden säädöt

Kieli
  • koitetaan saada yhteisöön läpi useampia kieli-indeksejä valittaviksi
  • jos yhteisöä ei kiinnosta ollenkaan, koitetaan luoda javascriptillä valikot lennossa, jotta ei tarvitse tehdä muutoksia Kohan koodiin.
Ikärajat
  • lisätään auktorisoitu arvo ikärajoille ja lisätään se AdvancedSearchTypes -järjestelmäasetukseen ja javascripitillä nimetään välilehti oikeaksi
Luokitus
  • yritetään lisätä valikkoon other-classification YKL-luokitus -nimellä javascriptillä
  • yritetään lisätä valikkoon udc-classification UDC-luokitus -nimellä javascriptillä
bib-level
  • yritetään lisätä javascriptillä subtype-valikkoon
    • bib-level:i nimellä Päivittyvä julkaisu
    • bib-level:s nimellä Kausijulkaisu

Tarkan haun valikkojen muokkaukset


Testaushuomioita 30.4. jälkeen

  • 710 ei ole author-name-corporate -indeksissä, pitäisikö olla? AÖ -> lisätään 710
  • author-name-personal-indeksissä on 400, miksi? AÖ -> auktoriteettikenttä henkilönnimi
  • author-indeksissä ei ole 400a, 710a, 711a, 800a, 810a, 811a. AÖ -> lisätään author-indeksiin
  • author-title-indeksissä on 400t, 410t, 411t, miksi? Tuollaisia ei ole olemassa marcissa. AÖ
  • 015 indeksoitu bfg-number- ja bnb-card-number -indekseihin, onko tarpeen? AÖ -> otetaan 015 pois bgf-number, bnb-card-number ja number-db-indekseistä.
  • conference-name-indeksissa 411? Tuollaista ei ole olemassa marcissa. AÖ
  • corporate-name-indeksissä 410? AÖ
  • ff-alkuiset-indeksit.. mitä ihmettä? 007/02 on "määrittelemätön", mitä hyötyä tuollaisesta on? AÖ -> tutkitaan lisää
  • 648a-kenttä puuttuu -> lisätään
  • 655a ja 655x -> lisätään subject-indeksiin
  • ln -> lisätään 041j

Testaushuomioita 6.5. jälkeen

  • 509ac Huomautus opinnäytteestä - suomalainen kenttä, 3AMK:lla tarve

Seuraavat kentät lisätty jo Kohaan mutta odottaa tieteellisillä Kohan päivitystä:
  • 041p
  • 022z
  • 022y
  • 020z
  • 084a

Mallirivi- MARC-kenttä
Muut tarpeet Puuttuu Zebrasta Tarvitaan Elasticiin yleisillä Tarvitaan Elasticiin tieteellisillä Huomautus Liittyvä tiketti
Relevanssilajittelu ei käytännössä toimi, osumilla eri kenttiin ei ole mitään painotuksia Kyllä #3883
Keyword-hakuja, jotka kohdistuvat kaikkeen tietueessa olevaan dataan (esim. soitinnus, huomautuskentät 5xx) kyllä kyllä
Lehden nimellä haku: haku on pystyttävä rajaamaan vain kausijulkaisuihin, eli niihin, joilla LDR/07= i tai s kyllä LDR/07 löytyy bib-level-indeksistä