Talk:Portal

data flow through biodiversity portals/providers
 * non-exclusive-eur data: DataProvider -> OBIS -> GBIF -> EurOBIS (filtered on eur-data)
 * exclusive-eur-data: DataProvider -> EurOBIS -> OBIS -> GBIF

frequency of caching:
 * EurOBIS every few months
 * OBIS every first wednesday of a month

Comment von Uwe Schindler zu ScientificCommon

Scientific Commons hat die Eigenschaft, dass es EPIC (und auch PANGAEA) harvestet via OAI-PMH, um erstmal die Dublin Core Metadaten zu bekommen. Das reicht ihm jedoch nicht und deshalb treibt es das ganze weiter: Es besucht die Zielseite (wie auch Google) und versucht dann herauszufinden, wo der Volltext zu finden ist (Analyse der HTML-Webseite). Da es bei dem SEPAN Paper weder eine PDF dazu gibt noch ein Abstract im Dublin Core geliefert wurde, macht er hier einen entscheidenden Fehler. Er sucht auf der Zielseite nach einem Link zu einer PDF.... Und da gibt’s nur einen, ganz rechts die Publication List. Und die versucht er wie Scholar zu analysieren. Und irgendwie verwexelt er die mit einem Paper... Als Folge findet man den Link zum „vermeintlichen“ Volltext findet man links im Scientific Commons Output. Das passiert bei allen Datensätzen in EPIC ohne PDF oder Abstract. Auch bei PANGAEA Datensätzen passiert das: Da wir grundsätzlich nie ne PDF haben (sind ja Daten) passiert hier immer, dass das zugehörige Paper aus der Referenz analysiert wird (wenn die URI direkt auf die PDF und nicht Splash-Seite zeigt). Da kann man leider nicht viel machen, so was passiert immer, wenn Entwickler wie bei Scientific Commons zuviel „Intelligenz“ in die Software checken (die „Intelligenz“ ist hier: „Es muss eine PDF auf dem Link hinter dem Dublin Core Datensatz geben. Wenn er nicht selbst direkt auf eine PDF zeigt, suche danach“). Dabei gibt es dann immer Ausreißer. Leider ist EPIC und PANGAEA davon sehr betroffen. Und man kann nichts tun (man könnte sich vielleicht beschweren, aber es würde nix helfen, weil die ja keine Datenbank haben, die man editieren könnte, alles ist ein großer Automatismus).