-
Notifications
You must be signed in to change notification settings - Fork 21
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Detectarea automată de declarații din știri #32
Comments
Incomplet, va fi continuat de acasa. 32_hartapoliticii_automated_extraction_of_declarations_from_news.patch
|
Voi continua de acasa. Idee: Ma folosesc de numele deja gasite si de ideea ca ele sunt pastrate in ordinea in care s-au gasit. De exemplu: Traian Basescu a spus "bla bla" iar Ponta a negat spusele. In cazul acesta o sa am urmatoarele asocieri: Traian Basescu - "bla bla" si Ponta - "bla bla", urmand ca un ochi uman sa si arunce ochii si sa stearga ce e irelevant. Alte imbunatatiri: sa caut si cuvinte cheie ca: "a spus", "a citat", "spune" etc. Indiferent de metoda tot va fi nevoie de un ochi uman care sa filtreze rezultatele din baza de date. Astept alte idei/sugestii. :D |
Deja harta politicii parsează și indexează știrile politice din Mediafax și Hotnews.
Codul este aici https://github.com/pistruiatul/hartapoliticii/tree/master/python/src/ro/vivi/news_parser
Și de obicei este rulat prin scriptul ăsta https://github.com/pistruiatul/hartapoliticii/blob/master/tools/news_parser.sh
Ar fi foarte interesant dacă am adăuga la acest script și o funcție de detectare a declarațiilor politicienilor.
Feature-ul ar putea fi implementat foarte simplu:
Ar fi okay dacă la început nu am detecta toate declarațiile ci doar o parte, cele ușor de detectat, urmând să fie îmbunătățit în viitor.
Vivi.
The text was updated successfully, but these errors were encountered: