Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Dokumente von DeepGreen holen #7

Open
j3nsch opened this issue Oct 22, 2024 · 0 comments
Open

Dokumente von DeepGreen holen #7

j3nsch opened this issue Oct 22, 2024 · 0 comments

Comments

@j3nsch
Copy link
Member

j3nsch commented Oct 22, 2024

Der DeepGreen Client soll (neue) Dokumente abrufen. Momentan gibt es eine OAI Schnittstelle mit eingeschränkten Metadaten und eine Web-API.

https://oa-deepgreen.github.io/user_docs/interfaces/webapi.html

Ohne weitere Änderungen an DeepGreen muss im Augenblick die WebAPI verwendet werden. Dabei werden anscheinend zuerst "Notifications" für das jeweilige Repository abgeholt. Anschließend können die Volltexte und ihre Metadaten einzeln abgeholt werden. Dafür gibt es Links in den Notifikationen.

In diesem Issue hier geht es nur um die Komponente(n) für das Abholen der Dokumente. Die Weiterverarbeitung soll davon unabhängig sein. Das heißt nicht, dass erst alle Volltexte abgeholt werden sollen, bevor die Weiterverarbeitung beginnt.

Es gibt also vermutlich mindestens zwei Teilkomponenten. Die erste holt die Notifikationen. Die zweite nimmt eine Notifikation und holte sich den passenden Volltext und seine Metadaten. Diese Aufteilung würde es z.B. auch ermöglichen Notifikationen zu empfangen (Push), statt zu holen, und dann den Workflow mit der zweiten Komponente fortzusetzen.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
Status: No status
Development

No branches or pull requests

1 participant