From 9f4e985165567e7d911abc7874b60b68a4d4dc95 Mon Sep 17 00:00:00 2001 From: notisset Date: Fri, 10 Nov 2017 00:53:36 +0100 Subject: [PATCH] Update 'README.md' --- README.md | 22 +++++++++++++++++++++- 1 file changed, 21 insertions(+), 1 deletion(-) diff --git a/README.md b/README.md index 12ddbea..df79373 100644 --- a/README.md +++ b/README.md @@ -51,7 +51,8 @@ Può essere facilmente delegato a un bot, un processo che una volta avviato è i Per fare questo è necessario individuare le risorse accessibili tramite la rete che rendano disponibile, in formato più o meno elaborato le informazioni sullo stato dei treni in circolazione. (Giangiorgino ha già controllato, il sito trenissimissimo.com fornisce questo servizio) -Di seguito vedremo alcune delle tecniche che possiamo utilizzare per crearne uno. +####Premessa + Il sito da cui andremo ad estrarre le informazioni e' il seguente: @@ -123,5 +124,24 @@ Una volta fatto questo torniamo sul sito ed effettuiamo una ricerca per stazione print(r.text.encode('utf-8')) +Ora che abbiamo il codice html della risposta alla nostra ricerca, possiamo usare beautifulsoup per estrarre solo le informazioni relative ai treni: + #! /usr/bin/env python + import requests + from bs4 import BeautifulSoup + headers = requests.utils.default_headers() + headers.update({"User-Agent": "Mozilla/5.0"}) + + data = { + 'codiceStazione': 'S01700Milano+Centrale', + 'lang': 'IT', + } + + r = requests.post('http://viaggiatreno.it/vt_pax_internet/mobile/stazione', headers=headers, data=data) + + soup = BeautifulSoup(r.text, 'html.parser') + treni = soup.find_all("div", class_="bloccorisultato") + + for treno in treni: + print(treno) \ No newline at end of file