-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathnote.txt
43 lines (29 loc) · 966 Bytes
/
note.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
captcha & python
* Breaking Visual CAPTCHAs with Naïve Pattern Recognition Algorithms: http://www.acsac.org/2007/papers/70.pdf
dehtmlizzatori piu’ usati:
* html2 e 2html
* html2text
* vilistextum (pulisce html)
filtri:
* sed (sostituzioni di pattern stringa)
* tr (sostituzione di caratteri)
* cut (estrae campi)
* awk (estrae campi, piu’ potente di cut)
* grep (estrae righe)
* sqlite
elaborazione:
* R
* Python
* Javascript
* gnuplot
Link utili
vedi csv
==================================
A POSTERIORI, note del giorno dopo
CSS a linea di comando:
http://stackoverflow.com/questions/7334942/is-there-something-like-a-css-selector-or-xpath-grep
http://superuser.com/questions/528709/command-line-css-selector-tool
http://videlibri.sourceforge.net/xidel.html
VARIE
http://jeroenjanssens.com/2013/09/19/seven-command-line-tools-for-data-science.html
(atrent) ho corretto lo script del bikemi, ora funziona di nuovo (c'erano le elettriche in piu')