ZPRÁVA Z PRACOVNÍ CESTY Discovery a linkovací technologie

(1)

ZPRÁVA Z PRACOVNÍ CESTY Discovery a linkovací technologie

3.11.2015 Marta Zizienová Místo semináře: NTK

Seminář probíhal dle programu. Nekonaly se prezentace “Xerxes” a “ProQuest ExLibris Primo.” Z hlediska UKN je zajímavé:

1.Úvod semináře Ing. Jiří Pavlík (Ústřední knihovna UK)

V JIB není discovery, ale federativní vyhledávač MetaLib, indexem je Primo Central Index. Linkserverem je linkserver SFX. Umožněno je jednotné přihlášení (eduID či mojeID či Facebook). V CPK je přihlášení přes FB, G+ a LinkedIn, linkování je přes servery jednotlivých organizací nebo SFX JIB, v r. 2016 se budou testovat centrální indexy. Google Scholar umožňuje přihlášení účty Google, linkování je jako u CPK, funguje plnotextové vyhledávání Open Access dokumentů, jinak záleží na jednotlivých poskytovatelích dokumentů (u indexovaných dokumentů se vyhledává v plných textech).

2.Linkovací systémy, jejich využití v praxi a propojení s Google Scholar Mgr. Michael

Zach (Ústřední knihovna UK)

Při používání dnešních knihoven se uživatel ocitá v chaosu, linkserver mu pomáhá najít to, co potřebuje napříč databázemi a poskytovateli. Knihovna pomocí linkserveru může aktivně ovlivňovat chování uživatelů, volit politiku zpřístupnění dokumentů, vytvářet vlastní lokální služby (propojení na katalogy, citační manažery, DDS aj.). Linkserver se ptá prostřednictvím openURL v jednotlivých dostupných systémech, v ideálním případě do něj rovnou propojuje. Zdrojové systémy mohou být placené EIZ, OPAC aj. Cílovými systémy jsou plnotextové placené EIZ, EZB, OPAC aj. Klíčovou součásti linkserveru je znalostní báze, důležitá je pravidelná aktualizace. V linkserveru jsou dostupné seznamy ečasopisů a eknih, ve kterých je možné vyhledávat. Součástí linkserveru je citation linker, kde se dá hledat na základě údajů z citace. V řazení se většinou na první místo řadí plnotextové služby.

Lze uvádět informace o vzdáleném přístupu, dostupnosti jen pro určitou fakultu, odkaz na OPAC, MVS, komerční eshop aj.

Google Scholar nabízí propojení na linkservery v nastavení, kde je možné zadat max.

5 knihoven, pak u hitů uvádí, zda je z daných knihoven dostupný plný text. Je možné přidat různé knihovny, nejen ty, kde je uživatel registrován. Pak si uživatel vytváří vlastní “virtuální souborný katalog.” (Není jasné, jak GScholar určuje pořadí, pokud je plný text dostupný z více knihoven.) Odkaz u hitu “další” vede na další možnosti, kde je plný text. GScholar neoznamuje, co má v centrálním indexu, takže nevíme, co vše zahrnuje. (U ostatních linkserverů si můžeme nastavit, co máme v knihovně nakoupené.)

Linkservery umí doporučovací službu jako u Amazonu, např. bX Recommender. Ta je založena na chování zákazníků. Umí také nabízet “hot articles,” kde uvádějí to, co se nejvíce aktuálně čte, upřesňovat lze i obor.

3.Discovery systémy (stručný přehled) Mgr. Petr Novák (Ústřední knihovna UK)

Účelem discovery je mimo jiné integrace informačních zdrojů různých druhů a

(2)

povahy, zjednodušení vyhledávání a šetření času uživatele. Obsah centrálního indexu sestává z kombinace sklízených metadat a zaindexovaných plných textů, zahrnuty jsou centrální katalog knihovny, repozitáře, licencované EIZ, open access tituly. Žádný centrální index nedisponuje metadaty všech existujících databází ani všech open access zdrojů.

Podstatná je srovnávací analýza před pořízením discovery systému a nasazení linkserveru.

Discovery systémy disponují funkcemi, které mohou, ale nemusí nahradit běžné funkce OPACu.

Komerční systémy EDS, Serials Solutions Summon, ExLibris Primo, OCLC WorldCat Discovery Service (v ČR není rozšířen, má ho např. DeWitt Wallace Library). Primo má např. VUT nebo Univerzita Pardubice. Není jasné, jak bude pokračovat Primo a EDS po akvizici společnosti Ex Libris společností ProQuest.

Opensource systémy jsou VuFind (např. ČístBrno.cz, prototyp CPK), Blacklight (např.

Stanford či Yale), Xerxes (UTB Zlín dodán index Summonu). V těchto systémech chybí centrální index a ten je nutné dodat (např. zakoupit a napojit komerční centrální index).

Interním indexovacím nástrojem v CPK pro VuFind je Solr, nástrojem pro statistiky je Piwik.

Statistika instalací discovery systémů do roku 2015 je dostupná na:

http://librarytechnology.org/repository/item.pl?id=21096. V NISO se rozhodly, že by bylo záhodno standardizovat chování aktérů zapojených do discovery systémů, vznikla Open Discovery Initiative. Výzvami do budoucna jsou mnoho zdrojů není v indexech zahrnuto, schází lepší pokrytí open access obsahu, je nutné zlepšit transparentnost v algoritmech stanovování relevance, odstranit nedostatky v indexování netextového obsahu, je záhodno vylepšit integraci s LMS.

Může existovat velká akademická knihovna programově bez discovery služby (ano:

Utrecht University Library)?

4.VuFind 2.0: příklad využití OS v knihovnách Mgr. Jan Kolátor (Národní technická

knihovna)

První přechod z Alephu do discovery v NTK zvládli všichni uživatelé, ale druhý přechod do jiného discovery už ne; preference uživatelů jsou různé. V souhrnu je procento návštěv stále stejné.

Výhody VuFindu jsou, že vše je volně šířeno a verze jsou volně upravitelné, ovšem postupně se do pracovních skupin vnesl organizační řád. Celý kód je na GitHubu, repozitář kódu je v PEAR. Vyhledávacím jádrem je Solr. VuFind přebírá obálky z lokálního úložiště, pak z obalkyknih.cz, pak z Amazonu, Google Books a dalších přednastavených poskytovatelů, stejně je možné pracovat s obsahy. Rozhraní je možné obohacovat o recenze z Amazonu, linky na autory do Wikipedie, Citace Pro aj.

5.EBSCO Discovery Service (EDS) Mgr. Jan Luprich (EBSCO)

EDS používá více než 9.000 zákazníků (např. MIT, Caltech, konsorcium OHIOLink).

V ČR je aktuálně 18 uživatelů. EDS bude dále pracovat na kvalitě relevance, detailních metadatech, integraci licencovaných bibliografií. U relevance rankingu se EDS řídí shodou předmětového hesla, slov z názvu, klíčových slov autora, klíčových slov v abstraktu, klíčových slov v plném textu. U dvou totožně hodnocených článků má prioritu aktuálnost (novější vydání), typ dokumentu (primární zdroj před recenzí), větší rozsah. EBSCO nabídlo svá metadata, podmínkou je integrace či spolupráce (https://www.ebscohost.com/metadatasharingpolicy). EDS je otevřený systém, lze z něj vyexportovat konkrétní data. EBSCO nevyvíjí vlastní katalog, ale spolupracuje s výrobci OPACů.

(3)

6.ProQuest´s Summon Ing. Vladimír Karen (Albertina icome Praha)

Summon je postaven na Lucene, Solr a RubyOnRails. Vytváří se jeden index (cca 3 miliardy vstupních záznamů). Po deduplikaci zůstávají cca 2 miliardy záznamů (záznam, rozšířená metadata, identifikátory, recenzováno, citovanost aj.), z nich je cca 1,4 miliardy vidět pro uživatele. Instituce si integruje vlastní zdroje, záznamy knih z katalogu se slučují se záznamy plných textů (procházejí mechanismem deduplikace). Záznamy jsou kategorizovány (na úrovni jednotlivých dokumentů) podle oborů (využívají kategorií LCC).

Pro řazení hitů jsou využívány statické (typ obsahu, datum vydání aj.) a dynamické váhy (frekvence termínů, vážení polí, stemming, aj.). Summon je součástí řady produktů nad společnou znalostní bází (Intota eResource, Intota Assessment, 360 Link). Integrovaný je ProQuest Flow. 360 Link využívá openURL. OpenURL linking není úplně spolehlivý nástroj (cca 530% odkazů není funkční). Cca 25% uživatelů neklikne na patřičný odkaz, kterým by se dostalo do plného textu. 360 Link integroval IEDL ze Summonu, přímé odkazy (pokud jsou k dispozici místo openURL). Summon má cca 1900 implementací, v ČR jich je aktuálně sedm.

Zpracovala: Marta Zizienová