© Universität Bielefeld

BASE Weblog

BASE Weblog - Tag [schnittstellen]

Über 200 Millionen Nachweise in BASE

Veröffentlicht am 13. August 2020

Die wissenschaftliche Suchmaschine BASE durchsucht das wissenschaftliche Web jetzt so umfangreich wie nie zuvor!

Seit kurzem enthält BASE über 200 Millionen Nachweise aus über 8.000 Quellen. Die Folgende Grafik zeigt den Zuwachs bei den indexierten Nachweisen und Quellen seit 2012.


Einen großen Anteil an dieser Steigerung hat die Indexierung wissenschaftlicher Publikationen aus Verlagen über die Crossref-Plattform. In unserer Quellenliste sind diese Quellen durch den Zusatz "via Crossref" gekennzeichnet. Ein verbesserter Workflow ermöglicht uns die schnellere Integration größerer Datenmengen. Die Verwendung der API-Schnittstelle von Unpaywall erlaubt es uns zudem mehr Dokumente als bisher mit dem Open-Access-Status zu versehen.

Trotz der großen Anzahl der indexierten Dokumente werden wie bisher auch Quellen und Dokumente ausgefiltert, wenn diese auf Grund technischer Probleme nicht erreichbar sind. Eine quellenübergreifende Dublettenkontrolle findet in BASE nicht statt, wir arbeiten jedoch weiterhin an diesem Thema. Es stellt sich bei der extremen Heterogenität der Daten als äußerst komplexes Thema heraus.

Ein Aspekt, der weitestgehend hinter den Kulissen abläuft, soll an dieser Stelle nicht unerwähnt bleiben: Wir konnten bereits Hunderte von Quellenbetreibern auf Probleme in ihrer OAI-Schnittstelle hinweisen. Diese werden in den allermeisten Fällen von den Quellenbetreibern zeitnah behoben, so dass die OAI-Schnittstellen funktionieren und korrekte Metadaten ausliefern. Davon profitieren neben BASE auch zahlreiche andere Dienste, die Inhalte via OAI indexieren.

Deutlich ausgebaut haben wir daher auch unsere Goldenen Regeln für Quellenbetreiber. Hier erklären wir detailliert, wie die Metadaten einer Quelle optimal bereit gestellt werden sollten, damit sie von BASE - aber natürlich auch von anderen Diensten, ohne Probleme indexiert werden können.

Wie bisher können die Inhalte über verschiedene Schnittstellen nachgenutzt werden. Hunderte Betreiber von Datenbanken, Suchmaschinen und Portalen aus aller Welt machen davon bereits Gebrauch.

Gesendet von Sebastian Wolf in Allgemein

Tag Hinweis

Auf dieser Seite werden nur die mit dem Tag [schnittstellen] versehenen Blogeinträge gezeigt.

Wenn Sie alle Blogeinträge sehen möchten klicken Sie auf: Startseite

Kalender

« März 2024
MoDiMiDoFrSaSo
    
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
       
Heute