Projekti

Yleinen

Profile

Indeksointityöryhmän palaverit

Päätöspalaveri 1.9.2021

Aika: 1.9.2021 klo 13
Läsnä: Anneli, Johanna, Anna, Ari, Heikki, Taru, Sirpa, Kai

Kesän aikana tulleet kommentit
  • A/the-artikkelien aakkostus ei toimi oikein, nimeke aakkostuu artikkelin mukaan, eikä oteta huomioon ohitusindikaattoreita
  • Teoksen nimen mukainen aakkostus ei toimi hyvin suomalaisessa ympäristössä: 240/130/245n mukaan, vasta sitten 245a-kentän mukaan. Erikoismerkit ensimmäisenä. #734
  • ! tai ? -merkkiin päättyvän nimen haku ei toimi, esim "Haloo Helsinki!" tai "Have you ever seen the Jane Fonda aerobic VHS?". Huutomerkkiin päättyvä nimi aiheuttaa keltaisen kuolemanlaatikon. Kysymysmerkkiin päättyvä ei anna tuloksia. Nämä ei toimi tosin Zebrankaan kanssa, jos QueryAutoTruncate on "automaattisesti": #2791 Elasticin kanssa ei toimi, vaikka valintana on "vain jos käyttäjä lisää jokerimerkin *".
Huomio Vaskista
  • puuttuu kokonaan 546a huomautus kielistä. Tarvitaan esim. kun pitää erottaa erottaa farsi ja dari, joilla kummallakin on kielikoodina persia.
    • indeksoidaan note-indeksiin

Ryhmän tavoite saavutettu

Määritykset ovat 546a-kentän lisäyksen jälkeen valmiita ja ryhmän toiminta on tullut päätökseen. Kiitos kaikille osallistujille! Aakkostukseen liittyviä ongelmia tutkitaan vielä lisää, mutta niihin ei ole mitään pikaista korjausta olemassa. ! tai ? -merkkeihin päättyviä hakuja opastetaan tekemään ilman kyseisiä merkkejä, koska haku ilman niitä toimii oikein.

Johanna asentaa uudet mäppäyksen Tätiin ja Vaskiin sekä toimittaa ne Kansalliskirjastolle tieteellisiä kirjastoja varten. Muille yleisten kimpoille Elasticsearch otetaan käyttöön viimeistään silloin, kun kimppa siirtyy Koha-Suomen yhteiseen konesaliin. Jos tulee tarvetta jatkossa miettiä tai säätää mäppäyksiä, Anneli kutsuu ryhmän koolle.


Palaveri 4.6.2021

Läsnä: Anneli, Kaija, Antti, Pasi, Satu, Taru, Anna, Johanna

Asiat:

  • testausten läpikäynti
    • muutokset toimii
    • Anneli ja Johanna selvittelee vielä, saisiko Nidetyypit-fasetin otsikon käännöksen eriytettyä käännöstiedostoissa omaksi "rivikseen", jolloin sen pystyisi kääntämään eri tavalla kuin mitä muissa paikoissa.
    • Johanna selvittelee, saako aineistotyyppit näkymään fasetissa kuvauksen mukaisena, ei tunnuksena.
  • Täydennetään Elasticsearchin indeksit -sivun tiedot mahdollisimman pian. Satu täydentänyt jo, muutkin saavat täydentää, jos löytyy vapaita hetkiä ja tarvittavat oikeudet.
  • Seuraava palaveri 1.9.2021 klo 13, jossa käydään läpi kesän aikana saatuja käyttökokemuksia.

Palaveri 27.5.2021

Aika: 27.5.2021 klo 9
Läsnä: Pasi, Anna, Kaija, Sirpa, Taru, Anneli, Satu, Johanna, Antti, Kai,

Asiat

  • testausten läpikäynti
  • aineistolaji-fasetissa sekä nidetyypit että aineistotyypit
    • siirretään 952y itemtype-indeksiin, jolloin itype-indeksiin jää vain 942c. Koitetaan muuttaa Nidetyyppi-fasetin nimi Aineistotyyppi-muotoon javascriptillä
  • osakohde/emokohde-fasetit - onnistuisiko 000_/7
    • muutetaan fasettia niin, että se hakee bib-level-indeksistä: emo=m, osakohde:a. Lisätään elasticin hakutyyli.
  • ä/a haussa tulkitaan samaksi kirjaimeksi
    • Kohan ominaisuus, jolla helpotetaan erikoismerkkien hakemista
  • tarkassa haussa aineistotyyppi/hyllypaikka/kokoelma/yms. välilehdillä valitessa hakuehtoja, tehdään OR-haku, pitäisi tehdä AND-haku. Johanna tutkii.
  • 509ac Huomautus opinnäytteestä - suomalainen kenttä, 3AMK:lla tarve
    • lisätään note-indeksiin
  • 024a lisätty indentifier-standard-indeksiin, jotta se on sru:n kautta haettavissa
  • Kansalliksirjastolla tarve 960-kentän indeksointiin
    • luodaan indeksi collection-960, johon indeksoidaan 960a

Palaveri 6.5.2021

Aika: 6.5.2021 klo 9
Läsnä: Kaija, Kai, Anna, Johanna, Taru, Satu

Asiat

  • seuraava palaveri 27.5.2021 klo 9-10

Palaveri 29.4.2021

Aika: 29.4.2021 klo 9
Läsnä: Anneli, Taru, Kaija, Antti Pasi, Johanna, Satu, Anna

Asiat
  • käytiin läpi aikaisemmin epävarmoiksi jääneet kohdat, mm. kielikoodit ja mietittiin niille ratkaisu.
  • mietittiin, miten saadaan tietoja valikkoon
  • Johanna tekee muutokset ja uudet indeksit mappings-tiedostoon ja lisää sen sitten testi-tätiin ja Vaskin Helle-palvelimen testikantaan. Kunhan muutokset ovat voimassa, testataan taas.
  • Nykyisen version Elasticsearchin tuki rajoittaa jonkin verran sitä, mitä pystytään toteuttamaan. Mm. indeksien lyhenteitä ei saatu toimimaan ja uusia fasetteja ei ehkä saada tehtyä.

Palaveri 27.4.2021

Aika: 27.4.2021 klo 12
Läsnä: Anneli, Johanna, Ari, Kaija, Antti, Pasi, Satu, Sirpa, Kai, Taru, Anna

Asiat

  • Käydään läpi testaushavainnot
  • Mietitään, mitä tarvitaan valikoihin ja miten ne pystyisi toteuttamaan

Seuraava kokous to 29.4.2021 klo 9


Palaveri 29.3.2021

Aika: 29.3.2021 klo 9
Läsnä: Anneli, Ari, Antti, Pasi, Johanna, Satu, Sirpa, Kai, Anna, Kaija

Asiat:

  • Lista nyt käyty läpi ja seuraavaksi Anneli listaa muutokset ja Johanna tekee niistä uudet mäppäykset. Sen jälkeen se asennetaan testi-tätiin ja Vaskin testille. Sitten vain testataan, miten hyvin onnistuttiin.
  • Vaskista tullut kysymys, miten fasetointi toimii ja pystyykö sitä säätämään kimppakohtaisesti. Johanna selvittää fasetoinnin salat

Seuraava palaveri 27.4.2021 klo 12


Palaveri 22.3.2021

Aika: 22.3.2021 klo 14
Läsnä: Johanna, Ari, Kaija, Antti, Pasi, Satu, Sirpa, Kai, Anna
Asiat:

Seuraava palaveri ma 29.3.2021 klo 9.


Palaveri 2.3.2021

Läsnä: Satu Niininen, Johanna Räisä, Kaija Asukas, Pasi Hynninen, Anna Viitanen, Kai Sormunen, Ari Albrecht, Taru Savula, Sirpa Janhonen,

Asiat:
  • Jatketaan taulukon läpikäyntiä
    • päästiin 5xx-kenttien loppuun. Jatketaan kuutosista seuraavassa palaverissa.
  • Lisärajausten eli ctype-haun määrittelyt puutteelliset: Merkkipaikat 008/24-27 eivät riitä tarkan haun pudotusvalikossa olevien vaihtoehtojen muodostamiseen, koska myös mp 000/06 vaikuttaa 008-kentässä käytettäviin koodeihin. Samat 008-koodit tarkoittavat eri asiaa riippuen siitä, mitä on 000-kentässä. Nykyisellä tavalla toteutettuna hakutuloksiin tulee siis myös vääriä tapauksia mukaan (ja kokonaisuudet eivät ylipäätään ole mielekkäitä haettavia). Esimerkiksi ”Tiivistelmät, lyhennelmät” -vaihtoehto (ctype:a) sisältää lisäksi myös karttoja (koska jos 000/06=e, mp 008/25=a=yksittäinen kartta). Musiikkiaineistossa 008/24-27 on käytössä liiteaineiston koodeilla, joten musiikki sotkee esim. sanakirjojen hakutulosta.
    • Tutkitaan, saako määritettyä kaksi ehtoa (Anneli ja Johanna), ja pohditaan voisiko lisärajaukset piilottaa.
  • Huomio: etuliitehaku tekee keyword-haun eikä fraasihakua, jos kirjoittaa esim. su:hirvi karhu tai ti:ensimmäinen ihminen. Eli jälkimmäistä sanaa haetaan kw-indeksistä, eikä fraasihakuna määritetystä indeksistä. Myöskään su,phr:hirvi karhu ei toimi. Haku toimii, jos laittaa su:(hirvi karhu)

Seuraava kokous: 22.3.2021 klo 14 Teamsissä


Palaveri 18.2.2021

Aika ja paikka: 18.2.2021 klo 10.15 Teamsissä
Läsnä: Antti Heikkinen, Markku Untinen, Johanna Räisä, Anna Viitanen, Taru Savola, Ari Albrecht, Anneli Österman, Kaija Asukas, Sirpa Janhonen, Kai Sormunen, Satu Niininen

Asiat:
  • Käydään läpi kommentit
    • Lähdettiin käymään tarvelistaa läpi kohta kerrallaan ja päästiin 0-alkuiset loppuun. Toimenpiteet, tarpeet yms. kirjattu tarvelistaan. Huomattu mm. ongelmia kenttien toistumien indeksoitumisessa
    • Jatketaan läpikäyntiä seuraavassa palaverissa

Sovittuja tehtäviä:

  • Anna etsii lisää esimerkkejä 041a:n toistumista tietueissa
  • Johanna tutkii, onko toistumaongelma myös yhteisöversiossa

Seuraava kokous ti 2.3.2021 klo 13.15


Aloituspalaveri 21.1.2021

Läsnä: Anneli Österman (Koha-Suomi), Johanna Räisä (Koha-Suomi), Kai Sormunen (Vaara-kirjastot), Antti Heikkinen (OUTI-kirjastot), Taru Savola (Lapin kirjastot), Sirpa Janhonen (Varastokirjasto), Satu Niininen (Kansalliskirjasto), Markku Untinen (Helle-kirjastot), Ari Albrecht (Lumme-kirjastot), Kaija Asukas (OUTI-kirjastot)

Asiat

  • miten edetään?
    • käydään läpi nykyiset indeksit ja niiden mäppäykset
    • Johanna asentaa testi-Tätiin tieteellisten uusimman mappings.yamlin ja tekee Melinda-integraation tarvimat muutokset siihen
    • Anna merkitsee indeksointitarpeet-wikiin jo löytämänsä puutteet
    • Johannalla ja Annalla vko 4 aikaa asennuksiin ja wikin päivitykseen, jonka jälkeen kaikki testaa testi-Tätissä hakua ja lisää indeksointitarpeet-wikiin huomionsa (Anneli lisää kaikille oikeudet wikiin)
    • käydään läpi testaustulokset seuraavassa palaverissa
    • Johanna selvittää, onko yhteisössä tehty muutoksia tarkan haun valikoihin Elasticia varten, koska kaikki indeksit eivät ole haettavissa alasvetovalikoiden vaihtoehtojen kautta ja osa niistä ei toimi Elasticin kanssa ollenkaan
    • tutkitaan fasetointi-määrityksen toimintalogiikkaa, Johanna aloittaa tutkimalla Kohan koodia.

Esille tulleita puutteita

  • 041a-kentän toistumat ei kaikki indeksoidu ja haettavissa

Tunnukset testi-Tätiin

https://tati.koha-suomi.fi:8092/

Osalla jo tunnukset olemassa Tätiin ja ne toimii myös testi-Tätissä. Anneli tekee tunnukset heille, joita ei niitä vielä ole. Tunnukset tarvitsee:
  • Anna
  • Kai
  • Sirpa
  • Markku
  • Satu

Seuraava palaveri 18.2.2021 klo 10.15