Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

zusätzlichen Crawler für wemgehoert.de einbinden #34

Open
MarkyMarkDE opened this issue Jan 12, 2024 · 3 comments
Open

zusätzlichen Crawler für wemgehoert.de einbinden #34

MarkyMarkDE opened this issue Jan 12, 2024 · 3 comments

Comments

@MarkyMarkDE
Copy link

es wäre schön, wenn du zusätzlich noch einen Crawler für www.wemgehoert.de einbinden und deren Kommentare und Bewertungen mit einfließen lassen könntest.
Beispiel: https://www.wemgehoert.de/nummer/443303709864
Ist eigentlich kein Bug, sondern ein "enhancement request" 😉

@MarkyMarkDE MarkyMarkDE changed the title zusätzlichen Crawler für wemhehoert.de einbinden zusätzlichen Crawler für wemgehoert.de einbinden Jan 12, 2024
@haumacher
Copy link
Owner

Tatsächlich hat PhoneBlock so einen Crawler, nur leider wehrt sich wemgehoert ganz aktiv dagegen:

image

Meine IP-Adresse wird von wemgehoert aktiv blockiert, so dass keine Abfrage mehr möglich ist...

@MarkyMarkDE
Copy link
Author

Tatsächlich hat PhoneBlock so einen Crawler, nur leider wehrt sich wemgehoert ganz aktiv dagegen:

image

Meine IP-Adresse wird von wemgehoert aktiv blockiert, so dass keine Abfrage mehr möglich ist...

not nice aber es gibt Möglichkeiten, weißt du sicherlich auch 😉
Die Frage ist nur, warum die blocken ... hat vielleicht jemand mit deiner IP dort Schindluder betrieben?

@MarkyMarkDE
Copy link
Author

MarkyMarkDE commented Jan 12, 2024

ah okay: https://www.wemgehoert.de/allgemeine-bedingungen

Copyright

Es ist verboten, die automatisierten Roboter (Sucher) auf diese Dienstleistung zu generieren, was auch das Aufsuchen, Sammeln und Hinterlegen von Daten seitens Dritter betrifft. Ebenfalls ist es untersagt das Kopieren der Texte oder der Teile dieser Dienstleistung seitens Dritter.

Vielleicht kann man ja mit denen kooperieren oder so, du gibst ihnen deine und die dir deren Daten oder so.

Ist eigentlich auch eine Frechheit von denen, die Nutzer melden sowas (deren Texte) und der Betreiber reißt das Copyright an sich, das dürfte so rechtlich nicht passen.

Interessant: .de TLD aber kein Impressum? Ist das so erlaubt? Serverstandort Frankreich und irgendeine windige Postfachadresse in Prag, alles klar lol

Es wird ja immer lustiger!

Die auf den Webseiten veröffentlichten Kommentare äußern die Ansichten der Benutzer der Webseiten und nicht des Betreibers, der für ihren Inhalt keine Verantwortung übernimmt.
https://www.wemgehoert.de/bedingungen-fur-das-hinzufugen-von-kommentaren

Aber das Copyright an sich reißen, unglaublich!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants