Indeksointitarpeet¶
- Table of contents
- Indeksointitarpeet
Elasticsearching mappings.yaml -tiedosto sivun liitteissä. Johanna lisännyt 27.1.2021 mappingsTati.yaml tiedoston, missä testi-Tätin määritykset.
Indeksointityöryhmän palaverit
Lista indeksointitarpeista¶
Tämä taulukko on indeksointityöryhmän työversio, eikä sisällä kirjausta kaikista olemassa olevista indekseistä. Täydellinen lista indekseistä ja mäppäyksistä.
MARC-kenttä | Tarvitaan Elasticiin yleisillä | Tarvitaan Elasticiin tieteellisillä | Huomautus | Tarvitaan uusi indeksi | Tarvitaan alias | Tarvitaan valikkoon | Liittyvä tiketti |
---|---|---|---|---|---|---|---|
041k - välikäännöksen kieli | kyllä | löytyy language-intermediate-translation -indeksistä eli haettavissa, tarvitaan alias | ei | kyllä: lit | kyllä | ||
041j - tekstityksen kieli | kyllä | Tarvitaanko valikkoon? | ei | ei | |||
041a - tekstin kieli | kyllä | ||||||
041d - puhuttu/laulettu kieli | kyllä | ei | ei | kyllä | |||
041h - alkukieli | kyllä | Löytyy indeksistä language-original. Ongelma: ei alasvetovalikkoa, pitää osata hakea "language-original:eng" ja muistaa kielikoodit | ei | ei | kyllä | ||
041e - libreton kieli | ei | Harvemmin edes luetteloidaan tieto tähän kenttään, vähän käytetty hauissa. Ei indeksoida. | ei? | ei? | ei? | ||
041f - sisällysluettelon kieli | ei | Pohdittava tarpeellisuus, vähän käytetty hauissa. Ei indeksoida. | ei? | ei? | ei? | ||
041g - liiteaineiston kieli | ei | Pohdittava tarpeellisuus, vähän käytetty hauissa. Ei indeksoida. Voidaan miettiä uudelleen myöhemmin, jos tarvetta ilmenee. | ei? | ei? | ei? | ||
041i - välitekstien kieli | ei | Pohdittava tarpeellisuus, vähän käytetty hauissa. Ei indeksoida. | ei? | ei? | ei? | ||
041p - kuulovammaisille tarkoitetun tekstityksen kieli | kyllä | Saavutettavuus-näkökulma, pohditaan vielä. Tehdään uusi indeksi ln-captions | |||||
041r - visuaalinen kieli (ei teksti) | kyllä | Pohdittava, saavutettavuus-näkökulma. Tehdään uusi indeksi ln-visual | |||||
041q | kyllä | Pohdittava, saavutettavuus-näkökulma. Tehdään uusi indeksi ln-acaudio | |||||
041t | kyllä | Pohdittava, saavutettavuus-näkökulma. Tehdän uusi indeksi ln-transcript | |||||
042a | kyllä | Fennica- ja Viola-tietueet saavat tunnuksen, tarve Kansalliskirjastolla | |||||
049c - Ikäraja | kyllä | kyllä | Indeksoidaan agelevel-indeksiin. Fasetiksi?/AÖ | ei | kyllä | #4163 ja #594 | |
080x - UDK-lisäluokka | kyllä | indeksoitu jo udc-aux-subdivision | ei | kyllä | ei? | ||
084a - YKL-luokitus | kyllä | kyllä | ODOTTAA HYVÄKSYNTÄÄ githubissa. kokeiltu lisätä other-classification-indeksi OUTIn testillä Elasticiin: Tarvii oman indeksin ja aliaksen, myös valikoihin. Huomioidaan toistumat. | kyllä: other-classification | kyllä: oc | kyllä | #4143 |
245b | Löytyy title-indeksistä viimeisimmän päivityksen jälkeen | ||||||
245c | Tarvitseekö tekijähaun etsiä tästä vastuullisuusmerkinnät-kentästä, vai onko kaikki tieto myös muualla (100a, 110a, 111a, 700a, 710a jne.)/ KS - tiputetaan pois author-indeksistä - Tämä oli vielä mukana author-indeksissä/AÖ Esimerkkitietue | ||||||
245p - osan nimi | kyllä | / AV. Kannatan/KA - tullut mukaan tieteellisten päivityksessä | |||||
257a - tuottajan maa | / AV. Hyödyllinen lisä/KA - lisätään place-of-origin-indeksiin | ||||||
264a | kyllä | Publisher location pitää kohdistaa tähän ja kenttään 260a - löytyy place-of-publication-indeksistä | |||||
264b | kyllä | Publisher-kenttä pitää kohdistaa tähän ja kenttään 260b - löytyy jo publisher-indeksistä | |||||
264c | kyllä | Publication date pitää kohdistaa tähän ja kenttään 260c - löytyy kumpikin date-of-publication-indeksistä nyt | |||||
300 | kyllä | kyllä | Löytyy extent-indeksistä | ei | ei | ||
336a, 337a ja 338a | kyllä | Toive tuli Kansalliskirjastosta. Pohdittiin kuitenkin, onko näille oikeasti tarvetta, koska kyseessä on koneluettevaksi tarkoitettuja kenttiä. Satu selvittää. ---> Ovat jo indekseissä content-type-term, media-type-term, carrier-type-term | |||||
341abcde | kyllä | kyllä | Ei löydy mistään, eikä sovellu mihinkään nykyisistä indekseistä. Tehdään uusi indeksi nimeltään accessibility-content | kyllä: accessibility-content | ei | ei? | |
347b | kyllä | kyllä | Ei löydy mistään indeksistä, tarvitaan, jotta voidaan hakea esim. Daisy-äänikirjoja. Tehdään uusi indeksin encoding-format | kyllä: encoding-format | ei | ei | |
348a | kyllä | kyllä | Löytyy notated-music-format-term-indeksistä | ei | kyllä: nmft | ei? | |
370g | kyllä | kyllä | Löytyy place-of-origin-indeksistä | ei | ei | ei | |
382abdpv | kyllä | kyllä | Löytyvät indekseistä | ei | ei | ei | |
383abce | kyllä | kyllä | Löytyvät indekseistä | ei | ei | ei | |
385a | kyllä | kyllä | Tehdään uusi audience-term-indeksi | kyllä: audience-term | ei | ei | |
386a | kyllä | kyllä | Tehdään uusi creator-term-indeksi | kyllä: creator-term | ei | ei | |
388a | kyllä | kyllä | Löytyy time-of-period-indeksistä | ei | ei | ei | |
500a - Huomautus | kyllä | kyllä | Löytyy note-indeksistä | ei | ei | ei | |
502abc | Löytyy dissertation-information-indeksistä | ei | ei | ei | |||
505agrt | Löytyy note-indeksistä | ei | ei | ei | |||
506af | Kummallekin oma indeksi olemassa | ei | ei | ei | |||
538a | Löytyy system-detail-note-indeksistä | ei | ei | ei | |||
540c | kyllä | Ei löydy mistään, tehdään uusi indkesi terms-governing-use-and-reproduction | kyllä: terms-of-governing-use-and-reproduction | kyllä: tgur | ei | ||
561a - Huomautus omistushistoriasta | Kyllä | löytyy: ownership-history | ei | ei | ei | #3883 | |
567b | kyllä | Löytyy methodoly-controlled-term-indeksistä | ei | ei | ei | ||
586a | kyllä | Löytyy awards-note-indeksistä | ei | ei | ei | ||
588a | kyllä | Löytyy description-source-note-indeksistä | ei | ei | ei | ||
590a - Kirjastokohtainen huomautuskenttä | kyllä | Kyllä | 590 kokonaisuudessan note-indeksissä - Hellessä käytössä / Myös Lapin kirjastossa/TS | ||||
594a - Kirjastokohtainen huomautuskenttä | kyllä | Fennican huomautuskenttä - lisätään note-indeksiin | |||||
598a - Kirjastokohtainen huomautuskenttä | Kyllä | Tritoniassa kurssikirjatiedot - lisätään note-indeksiin | |||||
599a - Kirjastokohtainen huomautuskenttä | Kyllä | Kyllä | 3AMK-kirjastoissa x-alkuisia huomautuksia eri aineistoille, esim. xkauppakamari. / Yleisistä kirjastoista ainakin Lapin kirjasto käyttää (Lapponica-tietokanta- ja saamelaisbibliografiamerkintöihin)/TS - lisätään note-indeksiin | ||||
610b - yhteisön nimi aiheena - alayksikkö | kyllä | kyllä | Löytyy name ja corporate-name -indekseistä. kw-haussa mukana. Lisätään subject-indeksiin | ei | ei | ei | |
630a - yhtenäistetty nimeke | kyllä | kyllä | Lisätään subject-indeksiin. / AV. Kyllä/KA | ei | ei | ei | |
630p - teoksen osan nimeke | kyllä | kyllä | Lisätään subject-indeksiin. / AV. Kyllä/KA | ei | ei | ei | |
648a - aikaa ilmaiseva termi | kyllä | kyllä | Lisätään subject-indeksiin. / AV | ei | ei | ei | |
650z | kyllä | kyllä | Lisätään su-geo-indeksiin | ei | ei | ei | |
655a - genre | kyllä | kyllä | Löytyy index-term-genre-indeksistä. - Yleisissä kirjastoissa YSO-konversio tekemättä, joten tarvitaan myös xyz | ei | ei | ei | |
655x | kyllä | kyllä | Lisätään index-term-genre-indeksiin. Voidaan poistaa, kun YSO-konversio tehty | ei | ei | ei | |
655y | kyllä | kyllä | Lisätään time-period-indeksiin. Voidaan poistaa, kun YSO-konversio tehty | ei | ei | ei | |
655z | kyllä | kyllä | Lisätään place-of-origin-indeksiin. Voidaan poistaa, kun YSO-konversio tehty | ei | ei | ei | |
765$t - alkukielisen julkaisun nimeke | Selvitetään, mistä tarve tullut ja lisätään sitten, jos tarpeen. | ||||||
767$t - ei-alkukielisen julkaisun nimeke | Selvitetään, mistä tarve tullut ja lisätään sitten, jos tarpeen. | ||||||
800t - sarjalisäkirjaus, henkiönimi- nimeke | kyllä | kyllä | Lisätään title-series-indeksiin | ei | ei | ei | |
830a - sarjalisäkirjaus, yhtenäistetty nimeke | kyllä | kyllä | Lisätään title, title-series, title-uniform -indekseihin | ei | ei | ei | |
830n - sarjalisäkirjaus, numero | kyllä | kyllä | Lisätään title, title-series, title-uniform | ei | ei | ei | |
830p - sarjalisäkirjaus, osan nimeke | kyllä | kyllä | Lisätään title, title-series, title-uniform | ei | ei | ei | |
830v - sarjalisäkirjaus, sarjan sisäinen numerointi | kyllä | kyllä | Lisätään title, title-series, title-uniform | ei | ei | ei | |
830x - sarjalisäkirjaus - issn | kyllä | kyllä | Lisätään issn-indeksiin | ei | ei | ei | |
852h - Paikkamerkin hyllyluokka | kyllä | kyllä | Tieteellisillä tarve saada sijaintihaku toimimaan kausijulkaisuissa ja monografioissa Ks. myös 852i Tämä kenttä voi ilmeisesti olla varasto- tai bib-tietueessa. Myös katkaisuhaku tähän kenttään on tarpeen. -> Tehdään uusi indeksi placement | kyllä: placement | ei | ei | #4143 |
852i - Kappaletta koskevat tiedot | kyllä | Sijaintihaku kausijulkaisuihin ja monoihin (852 h ja i) Tämä kenttä voi ilmeisesti olla varasto- tai bib-tietueessa. Löytyy location-item-part-indeksistä | ei | ei | ei | ||
866 - Vapaamuotoiset varastotiedot | ei | kyllä | -> koskee vain varastotietoja, ei oteta nyt mukaan, koska indeksointi ei yllä varastotietueisiin vielä. Huomautushaku sanahakuna | ||||
952S - hyllytarkenne | kyllä | ei | Lisätään uusi sublocation-indeksi, Johanna tutkii, osaako Elastic erotella ison ja pienen kirjaimen, koska 952s on viimeksi lainattu -tieto niteessä. Ei indeksoida tieteellisille, aikaisempi rasti virheellinen /JK | kyllä: sublocation | ei? | ei? | |
935a | Satu selvittää, onko tälle tarvetta -> ei tarvetta | ||||||
900a - Viitaus henkilön nimi | kyllä | kyllä | Lisätään author-indeksiin, koska auktoriteettitietueet eivät ole ajantasaiset. Voidaan poistaa indeksistä, kun auktoriteetit saadaan toimimaan oikein | ei | ei | ei | |
910a - Viitaus yhteisön nimi | kyllä | kyllä | Lisätään author-indeksiin, koska auktoriteettitietueet eivät ole ajantasaiset. Voidaan poistaa indeksistä, kun auktoriteetit saadaan toimimaan oikein | ei | ei | ei | |
911a - Viittaus kokouksen nimi | kyllä | kyllä | Lisätään author-indeksiin, koska auktoriteettitietueet eivät ole ajantasaiset. Voidaan poistaa indeksistä, kun auktoriteetit saadaan toimimaan oikein | ei | ei | ei | |
960a - Kokoelma | ei | kyllä | Fennican käyttämä kenttä, sis. esim. saamelaisbibliografian tiedot | kyllä: collection-960 |
- corporate-name-indeksiin määritetty 411, 611, 711, 811 -kentistä kaikki osakentät. Onko tämä tarpeen vai riittäisikö vain osa osakentistä? Anna ja Antti testaa vähäsen.
- mikä on editor-indeksin tarkoitus? Sinne menee 100a ja 700-kentät? Tällä hetkellä se tuntuu tarpeettomalta.
- name-and-title-indeksiin kaikkiin kenttiin at-osakentät
Testaushuomioita 29.4.2021¶
- uudet indeksien lyhenteet eivät toimi, koska niitä ei saada määritettyä nykyisessä Koha-versiossa.
- sublocation nimetään uudelleen subloc-indeksiksi, jotta se saadaan toimimaan myös tarkan haun Muita vaihtoehtoja -välilehdellä (ks. 1. kohta) /AÖ
- only-host-items ja only-component-parts-indeksit puuttuu? Vai toimiiko emo- ja osakohteiden haku jotenkin toisella tavalla? Toimiiko tieteellisillä? /AÖ
- tieteellisillä ei ole emo/osakohderajausta ollenkaan
- Johanna tutkii tätä lisää
- location-indeksi nimetään loc-indeksiksi, jotta tarkan haun hyllypaikka-rajaus toimii. (ks. 1. kohta) /AÖ
- 245c mukana vielä author-indeksissä /AÖ -> poistetaan
- 245p osan nimi - ei ollut mukana tietellisten mappingsissä. Lisätään title-indeksiin, jos ei saada tieteellisiltä.
- 245n eli osan numero, lisätään title-indeksiin
- 648a - kirjoitusvirhe koontiexcelissä, korjataan.
- 610b - jäänyt pois, lisätään.
- 336a, 337a, 338a tarvitaan Kansalliskirjastossa. Löytyvät jo indeksistä.
- 711t -> name-and-title (a:n lisäksi)
- kenttien toistumat eivät indeksoidu, eli esim. jos useampi kielikoodi, niin vain ensimmäinen merkintä indeksoituu. Anna testaa vielä.
- tähän paljastui syyksi se, että ln-indeksiin on indeksoitu vain 008:n merkkipaikat 35-37
- ln-indeksiin lisätään 041a ja 041d, jolloin myös toistumat voidaan hakea ln-haulla
- ln-audio-indeksiin lisätään 041d
- muutetaan interest-age-level-indeksin nimeksi agelevel
Valikot ja niiden säädöt¶
Kieli- koitetaan saada yhteisöön läpi useampia kieli-indeksejä valittaviksi
- jos yhteisöä ei kiinnosta ollenkaan, koitetaan luoda javascriptillä valikot lennossa, jotta ei tarvitse tehdä muutoksia Kohan koodiin.
- lisätään auktorisoitu arvo ikärajoille ja lisätään se AdvancedSearchTypes -järjestelmäasetukseen ja javascripitillä nimetään välilehti oikeaksi
- yritetään lisätä valikkoon other-classification YKL-luokitus -nimellä javascriptillä
- yritetään lisätä valikkoon udc-classification UDC-luokitus -nimellä javascriptillä
- yritetään lisätä javascriptillä subtype-valikkoon
- bib-level:i nimellä Päivittyvä julkaisu
- bib-level:s nimellä Kausijulkaisu
Tarkan haun valikkojen muokkaukset
Testaushuomioita 30.4. jälkeen¶
- 710 ei ole author-name-corporate -indeksissä, pitäisikö olla? AÖ -> lisätään 710
- author-name-personal-indeksissä on 400, miksi? AÖ -> auktoriteettikenttä henkilönnimi
- author-indeksissä ei ole 400a, 710a, 711a, 800a, 810a, 811a. AÖ -> lisätään author-indeksiin
- author-title-indeksissä on 400t, 410t, 411t, miksi? Tuollaisia ei ole olemassa marcissa. AÖ
- 015 indeksoitu bfg-number- ja bnb-card-number -indekseihin, onko tarpeen? AÖ -> otetaan 015 pois bgf-number, bnb-card-number ja number-db-indekseistä.
- conference-name-indeksissa 411? Tuollaista ei ole olemassa marcissa. AÖ
- corporate-name-indeksissä 410? AÖ
- ff-alkuiset-indeksit.. mitä ihmettä? 007/02 on "määrittelemätön", mitä hyötyä tuollaisesta on? AÖ -> tutkitaan lisää
- 648a-kenttä puuttuu -> lisätään
- 655a ja 655x -> lisätään subject-indeksiin
- ln -> lisätään 041j
Testaushuomioita 6.5. jälkeen¶
- 509ac Huomautus opinnäytteestä - suomalainen kenttä, 3AMK:lla tarve
Seuraavat kentät lisätty jo Kohaan mutta odottaa tieteellisillä Kohan päivitystä:
- 041p
- 022z
- 022y
- 020z
- 084a
Mallirivi- MARC-kenttä |
Muut tarpeet | Puuttuu Zebrasta | Tarvitaan Elasticiin yleisillä | Tarvitaan Elasticiin tieteellisillä | Huomautus | Liittyvä tiketti |
---|---|---|---|---|---|
Relevanssilajittelu ei käytännössä toimi, osumilla eri kenttiin ei ole mitään painotuksia | Kyllä | #3883 | |||
Keyword-hakuja, jotka kohdistuvat kaikkeen tietueessa olevaan dataan (esim. soitinnus, huomautuskentät 5xx) | kyllä | kyllä | |||
Lehden nimellä haku: haku on pystyttävä rajaamaan vain kausijulkaisuihin, eli niihin, joilla LDR/07= i tai s | kyllä | LDR/07 löytyy bib-level-indeksistä |