Metadatenarchiv und Volltext
Die Stellenanbieter archivieren die Volltexte der Stellen nicht und löschen meist nach Ablauf der Bewerbungsfrist das Jobangebot. OpenBiblioJobs erhält daher immer wieder unterschiedliche Anfragen zu längst abgelaufenen Stellen. Mal wurde vergessen, ein Ausdruck der Stellenausschreibung anzufertigen und man würde jetzt gerne nochmal zur Vorbereitung des Bewerbungsgespräches hineinschauen. Mal geht es um eine Auswertung einer großen Menge von Stellen, um z.B. zu schauen, wie viele Leitungsstellen in der Zeit von x bis y ausgeschrieben wurden oder wie sich die Jobbeschreibung geändert hat und der oder die Anfragende erhofft sich die Volltexte der Stellenausschreibungen bei uns zu finden.
Wir helfen gerne weiter, aber wir sind nicht besser als die Daten, die man uns gibt.
Grundsätzlich speichert OpenBiblioJobs nur die eingegebenen Metadaten ab, aber keine Volltexte der ausgeschriebenen Jobs.
Seit Januar 2019 haben wir allerdings das PlugIn Amber installiert. Diese kleine Erweiterung folgt dem angegebenen Link und legt so zu der gemeldeten Stelle einen Snapshot beim Internet Archive ab. Das Erstellen eines Snapshots erfolgt dabei automatisch, sofern die Webseite mit dem Jobangebot das Harvesten ihrer Seite nicht generell verbietet.
In der Listen- oder Detailansicht (Klick auf den Titel des Jobangebotes) erhalten die Jobsuchenden die Möglichkeit, zwischen der Orginalwebseite und dem Snapshot zu wählen, wenn sie einen kleinen Moment mit der Maus über dem verweisenden Link verweilen.
Ein direkter Klick auf den Originallink bzw. auf den Button “Continue to the page” führt zur Originalwebseite. „View the Snapshot“ bringt Sie zur archivierten Seite.
Diese Snapshots stehen damit für die oben beispielhaft aufgeführten Anfragen zur Verfügung.
Wie sollten Stellen möglichst gemeldet werden?
Beim Melden der Stelle ist die URL auf den Volltext wichtig, nicht auf die Übersichtsseite zu den Stellen zu verlinken, sondern auf den Volltext der Stelle, denn nur dann kann auch ein Snapshot vom Volltext der Stelle angefertigt werden.
Der Link muss vollständig sein, d.h. er muss mit http:// oder besser https:// beginnen. Er sollte keine Verfolgungs-ID von Facebook oder ähnlichem enthalten. Dies ist gut erkennbar am Ende der URL: ?fbclid=IwAR18PrNcN4YFmk3TTbpkH-qAGm7O71cr0dXJg3C5szEBQrB73HPAqSxDWDk oder erkennbar am Beginn ?utm_source=
Diese Klick-Ids bitte entfernen.
Wie kommt man nun an die Volltexte und welche Daten liefert OpenBiblioJobs?
Heute gab es auf Twitter eine Frage zum Zugang zum Archiv von OpenBiblioJobs. Der Bedarf ist bekannt und im Hintergrund arbeiten wir daran, unser Archiv für die Suche zu öffnen. Die Umsetzung erweist sich aber als aufwendiger und komplexer als zuerst gedacht. Es muss eine Lösung dafür gefunden werden, dass archivierte Stellen nicht in der Standardsuche des Angebots auftauchen. Schließlich sollen dort nur die aktuell ausgeschriebenen Stellen schnell aufzufinden sein. Daher bitten wir an dieser Stelle weiterhin um Geduld.
Wenn Sie den Volltext zu einer gerade abgelaufenen Stelle suchen, nehmen Sie Kontakt zu uns auf. Wir ermitteln anhand Ihrer Angaben die URL der alten Stellenausschreibung und folgen dieser zum Internet Archive. Sie erhalten in der Antwort dann den Link zu der archivierten Stellenseite beim Internet Archive.
Für größere Auswertungen stellen wir Ihnen die Metadaten als CSV-Abzug zur Verfügung und Sie können anhand der darin enthaltenen Links zur Stellenanzeige selbst beim Internet Archive prüfen, ob ein Volltext-Snapshot vorliegt. Unsere Daten stellen wir Ihnen unter der aktuellsten CC-BY-Lizenz zur Verfügung.
Einen aktuellen Datenauszug finden Sie auf GitHub. Auf Anfrage, werden die dort hinterlegten Daten aktualisiert. Auf GitHub sind auch die Daten der vorhergehenden Google-Lösung zu finden, sodass Ihnen bei Bedarf somit die Metadaten seit Juli 2012 zur Verfügung stehen.