• No results found

Framgångsfaktorer och systemets utveckling

In document Databas för forskningsdata, VTI (Page 68-77)

Under fokusgruppsdiskussionerna framhölls farhågor för att systemet skulle försvåras av naturlig personalomsättning bland de som utvecklar den. För att motverka detta krävs att utvecklingen dokumenteras nogsamt.

Systemet kräver minst två gränssnitt mot databasen. Ett för sökning samt ett för inmatning av data. Import av externa data bör utredas för att minimera arbetet för den enskilde forskaren. Då den medföljande databasmotorn i ICAT genom sina tidigare nämnda begränsningar inte kan möta VTIs lagringsbehov måste den ersättas. Enligt utförd analys är PostgreSQL det naturliga valet men innan beslutet tas bör förutsättningarna för drift, säkerhetskopiering samt återställning utredas.

Kravspecifikationen är inte komplett utan tar enbart upp de krav som framkommit ur

fokusgruppernas diskussioner. Således bör den ses som ett första utkast och bör uppdateras i takt med vidare utredningar.

Då det saknas både relevanta thesaurus och datakatalog för ICAT föreslår jag att Nesstar, Maderia, Cessda och The Dataverse Network Project utvärderas ytterligare och att all

information som kan inhämtas om thesaurus och datakatalog inhämtas. Detta kan komma att kräva resurser för att få tillgång till demonstrationer och dokumentation.

9 Utvärdering

Arbetet gick åt till att bilda en uppfattning om ämnet, därefter möjliga tekniker, möjliga produkter och kompletterande informationsinsamling. Utöver detta lades två hela

arbetsveckor på att installera och felsöka ICAT. Ansatsen till arbetet var holistiskt, med syftet att kunna ge en bild av både behoven och problemens storlek och mängd.

Alternativet till detta hade varit att antingen fokusera på ett delsystem för att kunna demonstrera nyttan med ett lagringssystem eller att fokusera på att fastlägga en metadatamodell på djupet.

En implementation hade gett vinster i fallet för den enskilda berörda utrustningen eller forskningen. Det skulle däremot vara kontraproduktivt ur perspektivet att data ska kunna jämföras med annan data och att metadata därmed bör vara konsekvent mellan all lagrad data. I sämsta fallet skulle en implementation vid senare tillfälle behöva göras om för att kunna interagera med senare vald mjukvara och metadatamodell.

Att fastställa en metadatamodell skulle innebära ett omfattande utredningsarbete, vilket inte skulle låta sig göras inom utsatta tidsramar.

Således ser jag upplägget av arbetet som rimligt. Flera gånger under arbetets gång avvek arbetet från tidigare överenskommet upplägg som en följd av inhämtad kunskap om problematiken med att lagra data. I backspegeln ser jag det som högst befogat.

En parameter som hade kunnat förändra arbetet hade varit om det funnits en större öppenhet kring att dela med sig av rådata publikt. Det hade möjliggjort en mer djuplodande och därmed mer spännande utvärdering av fler utav systemen för datalagring.

Som med så många andra rapporter har informationssökningen varit det mest frustrerande momentet. Ett ofrånkomligt faktum som jag hoppas att denna rapport underlättar för de framtida studenter som kommer vara involverade i arbetet med VTIs datalagring.

Källor

Skriftliga

Baca Murtha, Introduction to Metadata, Getty Research Institute, 2008

Bjelvenstam J m fl, VTI i ord och siffror för 2008: Årsredovisning, 2008 Statens väg och transportforskningsinstitut, 2008, s 1-2

Boston Geographic Information Systems (BGIS), Cross Compare SQL Server 2008 Spatial,

PostgreSQL/PostGIS 1.3-1.4, MySQL 5-6 [Online]. Tillgänglig via:

http://www.bostongis.com/PrinterFriendly.aspx?

content_name=sqlserver2008_postgis_mysql_compare, [Hämtad den 2010-02-09] Charles Babcock, In Database Market, Oracle Gets Bigger, Others Hang On [Online]. Tillgänglig via:

http://www.informationweek.com/news/software/database_apps/showArticle.jhtml? articleID=207402230, [Hämtad den 2010-12-08]

Chung K, Management: Critical success factors, Allyn and Bacon Inc, 1987, s 543

CESSDA, CESSDA - Council of European Social Science Data Archives [Online]. Tillgänglig via: http://www.cessda.org/accessing/catalogue/, [Hämtad den 2010-02-24]

Cunningham L, Oracle Database 10g Express Edition: Not Just for Learners [Online]. Tillgänglig via: http://www.oracle.com/technology/pub/articles/cunningham-database- xe.html, [Hämtad den 2010-02-09]

Data Documentation Initiative, Data Documentation Initiative (DDI) Technical Specification,

Part I: Overview [Online]. Tillgänglig via: http://sourceforge.net/projects/ddi-

alliance/files/Data%20Documentation%20Initiative/DDI%203.1%20%282009-10-

18%29/DDI_3_1_2009-10-18_Documentation_XMLSchema.zip/download, [Hämtad den 2010-02-24]

Dataverse Network Project, The Dataverse Network Project [Online]. Tillgänglig via: http://thedata.org/fact_sheet/DataverseNetwork_Project [Hämtad den 2010-02-28] Date, An introduction to Database systems, Seventh Edition, Addison-Wesley Longman, 2000, s

DDI Alliance, Benefits of DDI [Online]. Tillgänglig via: http://www.ddialliance.org/ddi-at- work, [Hämtad den 2010-02-24]

Directions Magazine, Oracle XE and Geospatial Information Systems: An Interview with

Dennis Wuthrich of Farallon Geographics [Online]. Tillgänglig via:

http://www.directionsmag.com/article.php?article_id=2449, [Hämtad den 2010-02-09] Elmasri, Fundamentals of Database Systems, Navathe, Fourth edition, Pearson education, 2004

Elmasri, Fundamentals of Database Systems, Navathe, Fitfth edition, Pearson education, 2007, s477,530

Lee Feigenbaum, Ivan Herman, Tonya Hongsermeier, Eric Neumann, Susie Stephens, The

Semantic Web in Action [Online]. Tillgänglig via:,

http://www.scientificamerican.com/article.cfm?id=semantic-web-in-actio, [Hämtad den 2010- 02-10]

Fidel Raya, Database design for information retrieval, A conceptual Approach, John Wiley & sons, New York, 1987

Damian Flannery, ICAT: NOBUGS 2008 [Online]. Tillgänglig via:

http://www.nbi.ansto.gov.au/nobugs2008/talks/139.ppt, [Hämtad den 2010-04-06]

Rich Gibson, Build a Google Earth Interface on Oracle Database XE [Online]. Tillgänglig via: http://www.oracle.com/technology/pub/articles/gibson-xe-googleearth.html 2006, [Hämtad den 2010-02-25]

Simon Greener, SpatialDB Advisor: SpatialDB Comparison [Online]. Tillgänglig via: http://www.spatialdbadvisor.com/SpatialDBComparison/, [Hämtad den 2010-02-09]

Grudens-Schuck N, Lundy Allen B, Larson K (2004), Focus Group Fundamentals [Online]. Tillgänglig via: http://www.extension.iastate.edu/Publications/PM1969B.pdf [Hämtad den 2010-12-11]

Antonin Guttman, R-trees: A Dynamic Index Structure for Spatial Searching, International conference on management of data, 1984 [Online]. Tillgänglig via:

http://postgis.refractions.net/support/rtree.pdf, [Hämtad den 2010-09-10] HDFGroup, The HDF Group - Why use HDF? [Online]. Tillgänglig via: http://www.hdfgroup.org/why_hdf/, [Hämtad den 2010-02-10]

Joseph M. Hellerstein, The Gist of the GiST [Online]. Tillgänglig via: http://gist.cs.berkeley.edu/gist1.html, 7 aug 2009, [Hämtad den 2010-02-09]

Ivan Herman, http://digg.com/software/Semantic_Web_FAQ_by_W3C [Online]. Tillgänglig via: http://www.w3.org/2001/sw/SW-FAQ#relXML, [Hämtad den 2010-02-10]

Diane Hillmann, Using Dublin Core [Online]. Tillgänglig via:

http://dublincore.org/documents/usageguide/#whatis [Hämtad den 2010-02-23]

B. Howe, K. Tanna, P. Turner, D. Maier, Emergent semantics: Towards self-organizing

scientific metadata [Online]. Tillgänglig via:

http://web.cecs.pdx.edu/~howe/pubs/howemaier_sfnw04.pdf, Proc. of the 1st Intl. IFIP Conference on Semantics of a Networked World: Semantics for Grid Databases (ICSNW

IBM, Index on expression [Online]. Tillgänglig via:

http://publib.boulder.ibm.com/infocenter/dzichelp/v2r2/index.jsp?

topic=/com.ibm.db29.doc.intro/db2z_indexonexpression.htm, 2009, [Hämtad den 2010-07- 06]

IBM, IBM DB2 Spatial Extender [Online]. Tillgänglig via:

http://www.info.teradata.com/eDownload.cfm?itemid=091270004, [Hämtad den 2010-02-09] IBM, IBM - DB2 Express-C Overview [Online]. Tillgänglig via: http://www-

01.ibm.com/software/data/db2/express/about.html?S_TACT=index&S_CMP=expcsite , [Hämtad den 2010-02-09]

IBM, IBM - Spatial gis - DB2 Spatial Extender for Linux, UNIX and Windows [Online]. Tillgänglig via: http://www-01.ibm.com/software/data/spatial/db2spatial/, [Hämtad den 2010- 02-09]

Mattew B. Jones, Chad Berkeley, Jivka Bojilova, Mark Schildhauer, Managing Scientific

Metadata [Online]. Tillgänglig via: IEEE Internet Computing, Volume 5, Issue 5, p. 59 - 68,

2001

Wayne Jones, Judith R. Ahronheim, Josephine Crawford, Cataloging the web, Metadata

AACR, and Marc 21, 2002, s 155-157

Li Frederick B, Chan Sherman S.M, Li Qing, Lau Rynson W.H, Server Architectures for

Interactive Multimedia Applications, ICICS-PCM 2003

Länsstyrelserna, Länsstyrelsegemensam standard: Metadata för geografisk information [Online]. Tillgänglig via: http://gis.lst.se/presentationer/Rapport_LstMetadata_rev1027.doc, 2006, [Hämtad den 2010-02-23]

Lövgren Mats, Sökmotorerna klarar inte jobbet – webben växer för fort [Online]. Tillgänglig via: http://nyheter.idg.se/display.pl?ID=980408-MD2, [Hämtad den 2010-08-12]

MADERIA Project, MADIERA [Online]. Tillgänglig via: http://www.madiera.org/, [Hämtad den 2010-02-24]

Merriam-Webster Online Dictionary, metadata - Definition from the Merriam-Webster

Online Dictionary [Online]. Tillgänglig via: http://www.merriam-

webster.com/dictionary/metadata, [Hämtad den 2010-12-22]

Microsoft, How to implement Spatial Index in SQL Server? [Online]. Tillgänglig via: http://social.msdn.microsoft.com/Forums/en-US/sqldatabaseengine/thread/23acb073-e6de- 4551-a138-d4f3d0407821, 2006, [Hämtad den 2010-02-13]

Microsoft, Microsoft SQL Server 2005: Compare Features [Online]. Tillgänglig via: http://www.microsoft.com/Sqlserver/2005/en/us/compare-features.aspx, [Hämtad den 2010- 02-09]

MySQL, MySQL Bugs: #6989: Timestamp does not include milliseconds [Online]. Tillgänglig via: http://bugs.mysql.com/bug.php?id=6989, [Hämtad den 2010-02-09]

Molander B, Vetenskapsfilosofi: En bok om vetenskapen och den vetenskapande människan, 1988, s 144-147

Mike Morrison, Critical Success Factors - CSF analysis, formulation and construction [Online]. Tillgänglig via: http://rapidbi.com/created/criticalsuccessfactors.html [Hämtad den 2010-12-15]

National Center for Ecological Analysis and Synthesis (NCEAS), Administrator's Guide for

Metacat 1.9.1 [Online]. Tillgänglig via: [Hämtad den 2010-12-28]

http://knb.ecoinformatics.org/software/dist/MetacatAdministratorGuide.pdf [Hämtad den 2010-03-14]

NCEAS, Administrator's Guide for MetaCat 1.9.4, [Online]. Tillgänglig via: http://knb.ecoinformatics.org/software/dist/MetacatAdministratorGuide.pdf

Norwegian Social Science Data Services, Nesstar Getting Started Guide Version 3.5 [Online]. Tillgänglig via: http://www.nesstar.com/export/sites/default/doc/Getting_Started_v3.5sp1.pdf, [Hämtad den 2010-01-14]

Oracle, Oracle® Database Express Edition 2 Day Plus Locator Developer Guide [Online]. Tillgänglig via:

http://download.oracle.com/docs/cd/B25329_01/doc/appdev.102/b28004/toc.htm, [Hämtad den 2010-02-09]

Piattini Mario, Díaz Oscar, Advanced Database Technology and Design, Norwood Ma: Artech house inc., 2000

Moritz Reide, Rico Schueppel, Kristian O. Sylvester-Hvid, Martin Kühne, Michael C.Röttger, Klaus Zimmermann, Andreas Liehr, On the Communication of Scientific Results: The Full-

Metadata Format [Online]. Tillgänglig via:

http://arxiv.org/PS_cache/arxiv/pdf/0904/0904.1299v1.pdf, 2009, [Hämtad den 2010-02-24] Rumble JR Jr, Smith F J, Database systems in Science and Engineering, Adam Hilger, Bristol, 1990

Russ Rew, NetCDF FAQ [Online]. Tillgänglig via:

http://www.unidata.ucar.edu/software/netcdf/, [Hämtad den 2010-02-24]

Jan Ruzicka , Comparison of CEN, FGDC and ISO standards for metadata [Online]. Tillgänglig via: http://www.ec-gis.org/Workshops/7ec-gis/presentations/Ruzicka.pdf, 2001, [Hämtad den 2010-02-23]

Science and Technology Facilities Council, ICAT [Online]. Tillgänglig via: http://wwwisis2.isis.rl.ac.uk/DataAnalysis/icat/, [Hämtad den 2010-04-05]

STFC (Science and Technology Facilities Council), E-science, Data-management [Online]. Tillgänglig via: http://www.e-science.stfc.ac.uk/organisation/scientificapplications/data- management/datamanagement.html, [Hämtad den 2010-04-05]

Knut Stolze, Basic text indexing with DB2 index extensions [Online]. Tillgänglig via:

http://www.ibm.com/developerworks/data/library/techarticle/dm-0805stolze2/index.html, 15 maj 2008, [Hämtad den 2010-09-13]

Teodor Sigaev, Oleg Bartunov, Gin for PostgreSQL [Online]. Tillgänglig via: http://www.sai.msu.su/~megera/wiki/Gin, 2006, [Hämtad den 2010-09-21]

David Silverman ed, Qualitative Research - Research, Method and Practice, 2004, Sage Publications, Thousand Oaks, California, sid 178.

Schroeder B, Garth A. Gibson, Disk failures in the real world:

What does an MTTF of 1,000,000 hours mean to you? Proceedings of the 5th USENIX

Conference on File and Storage Technologies, 2007, San Jose, CA, Artikel 1, s 1 Sybase, Sybase IQ Administration Guide [Online]. Tillgänglig via:

http://manuals.sybase.com/onlinebooks/group-

iqarc/iqg1121e/iq_admin/@Generic__BookTextView/11894;hf=0 , 2010, [Hämtad den 2010- 09-21]

Sybase, SyBooks Online [Online]. Tillgänglig via: http://infocenter.sybase.com/help/index.jsp?

topic=/com.sybase.dc30119_1500/html/installlnx/installlnx13.htm, [Hämtad den 2010-02-09] Shoaib Sufi, Some of the Why's of ICAT, Spinning the semantic web, Bringing the World

Wide Web to its full potential. 2003, The MIT Press, Cambridge, Massachusets

Shoaib Sufi, Brian Matthews, A Metadata Model for the Discovery and Exploitation of

Scientific Studies [Online]. Tillgänglig via:

http://epubs.stfc.ac.uk/bitstream/1006/coregridbook-csmd.pdf 2007, [Hämtad den 2010-02- 19]

Techtarget, What is data dictionary? - Definition from Whatis.com [Online]. Tillgänglig via: http://searchsoa.techtarget.com/sDefinition/0211896,00.html [Hämtad den 2010-03-14] Teradata, SQL Geospatial Types [Online]. Tillgänglig via:

http://www.info.teradata.com/eDownload.cfm?itemid=091270004, [Hämtad den 2010-02-09] Teradata, Teradata Express Edition 12.0 | Teradata Developer Exchange [Online].

Tillgänglig via: http://developer.teradata.com/tools/articles/teradata-express-edition-12-0, [Hämtad den 2010-02-09]

Timos K. Sellis, Nick Roussopoulos, Christos Faloutsos: The R+-Tree: A Dynamic Index for

Multi-Dimensional Objects. VLDB 1987, [Online]. Tillgänglig via:

The Dublin Core Metadata Initiative, DCMI Metadata Basics [Online]. Tillgänglig via: http://dublincore.org/metadata-basics/ [Hämtad den 2010-02-23]

Sean B. Palmer, The Semantic Web: An Introduction [Online]. Tillgänglig via: http://infomesh.net/2001/swintro/, [Hämtad den 2010-02-10]

PostgreSQL, Partial Indexes [Online]. Tillgänglig via:

http://www.postgresql.org/docs/8.0/static/indexes-partial.html, [Hämtad den 2010-01-01] Michael Quinn Patton: Qualitative Reasearch & Evaluation methods, 2002, Sage

Publications, Thousand Oaks, California, s 399-352

VTI, Välkommen till VTI, Statens väg och transportforskningsinstitut, 2006, s 1

VTI, Om VTI: VTI [Online]. Tillgänglig via: http://www.vti.se/templates/Page____4.aspx [Hämtad den 2009-12-08]

VTI, Om VTI: Organisation [Online]. Tillgänglig via:

http://www.vti.se/templates/Page____2623.aspx, [Hämtad den 2009-12-08]

Wan Dylan, Bitmap Index – when to use it? « Dylan’s BI Study Notes [Online]. Tillgänglig via: http://dylanwan.wordpress.com/2008/02/01/bitmap-index-when-to-use-it/, 1 feb 2008, [Hämtad den 2010-02-02]

Wikipedia, Comparison of relational database management systems [Online]. Tillgänglig via:

http://en.wikipedia.org/wiki/Comparison_of_relational_database_management_systems, [Hämtad den 2010-02-16]

Yas, Reverse Key Index [Online]. Tillgänglig via:

http://oracletoday.blogspot.com/2006/09/there-is-option-to-create-index.html, 2006, [Hämtad den 2010-02-02]

Zittrain J och Edelman B, Localized Google search result exclusions - Statements of issues

and call for data [Online]. Tillgänglig via: http://cyber.law.harvard.edu/filtering/google/,

Personlig kommunikation

14/12 2009, Roger Johansson, VTI - Data och IT 18/1 2010, Staffan Jernberg, Enhetschef VTI 19/1 2010, Laila Engström, VTI

På svenska

Detta dokument hålls tillgängligt på Internet – eller dess framtida ersättare –

under en längre tid från publiceringsdatum under förutsättning att inga extra-

ordinära omständigheter uppstår.

Tillgång till dokumentet innebär tillstånd för var och en att läsa, ladda ner,

skriva ut enstaka kopior för enskilt bruk och att använda det oförändrat för

ickekommersiell forskning och för undervisning. Överföring av upphovsrätten

vid en senare tidpunkt kan inte upphäva detta tillstånd. All annan användning av

dokumentet kräver upphovsmannens medgivande. För att garantera äktheten,

säkerheten och tillgängligheten finns det lösningar av teknisk och administrativ

art.

Upphovsmannens ideella rätt innefattar rätt att bli nämnd som upphovsman i

den omfattning som god sed kräver vid användning av dokumentet på ovan

beskrivna sätt samt skydd mot att dokumentet ändras eller presenteras i sådan

form eller i sådant sammanhang som är kränkande för upphovsmannens litterära

eller konstnärliga anseende eller egenart.

För ytterligare information om Linköping University Electronic Press se

förlagets hemsida

http://www.ep.liu.se/

In English

The publishers will keep this document online on the Internet - or its possible

replacement - for a considerable time from the date of publication barring

exceptional circumstances.

The online availability of the document implies a permanent permission for

anyone to read, to download, to print out single copies for your own use and to

use it unchanged for any non-commercial research and educational purpose.

Subsequent transfers of copyright cannot revoke this permission. All other uses

of the document are conditional on the consent of the copyright owner. The

publisher has taken technical and administrative measures to assure authenticity,

security and accessibility.

According to intellectual property law the author has the right to be

mentioned when his/her work is accessed as described above and to be protected

against infringement.

In document Databas för forskningsdata, VTI (Page 68-77)

Related documents