merged replace_sodipy

added some description to functions
small fix
2023-09-20 13:27:34 +02:00 · 2020-04-17 16:43:36 +02:00 · 2020-04-17 16:33:41 +02:00
3 changed files with 147 additions and 23 deletions
--- a/7
+++ b/7
@ -26,6 +26,11 @@ sensori_aria_2017.zip - 13M
 sensori_aria_2018.zip - 13M
 sensori_aria_2019.zip - 13M

+
+questi dati si trovano qui':
+https://www.dati.lombardia.it/browse?q=dati%20sensori%20aria
+
+
 per visualizzarne i dati e' necessario scaricare l'intero file in una cartella, che di default e' csv/
 ma puo' essere modificata nel file openlamb.py
 lo script se non trova i files necessari nella cartella specificata li scarica in formato .zip
@ -39,7 +44,7 @@ ogni volta che si lancia lo script viene salvato un file export.csv che contiene

 requisiti:
  python3
-  pip3 install sodapy matplotlib pandas
+  pip3 install sodapy matplotlib pandas tabulate


 sintassi:
--- a/openlamb.py
+++ b/openlamb.py
@ -4,20 +4,30 @@ import argparse
 import traceback
 import sys
 import pandas as pd
+import requests
 import numpy as np
-from sodapy import Socrata
 import matplotlib.pyplot as plt
 import re
+import json
 import glob
 import os
 from os import getcwd, chdir

 path_to_csv_files = "csv/"

-datasets_ambiente = {"2020": "nicp-bhqi",
-                     "2019": "kujm-kavy",
-                     "2018": "bgqm-yq56",
-                     "2017": "j8j8-qsb2"}
+datasets_ambiente = {"3000": "nicp-bhqi",
+                     "2018": "g2hp-ar79",
+                     "2017": "j8j8-qsb2",
+                     "2010": "nr8w-tj77",
+                     "2000": "cthp-zqrr",
+                     "1999": "evzn-32bs",
+                     }
+# 1999 fino al 1999
+# 2000 dal 2000 al 2009
+# 2010 dal 2010 al 2017
+# 2018 sono i dati dal 2018 ad oggi
+# 3000 sono i dati dell'anno corrente
+

 csv_ambiente = {"sensori_aria_1968-1995.zip": "puwt-3xxh",
                "sensori_aria_1996-2000.zip": "wabv-jucw",
@ -35,14 +45,54 @@ csv_ambiente = {"sensori_aria_1968-1995.zip": "puwt-3xxh",
                "sensori_aria_2019.zip": "j2mz-aium"}


-def _connect():
-    client = Socrata("www.dati.lombardia.it", None)
-    return client
+class SocrataClient:
+    def __init__(self, domain, app_token=None):
+        self.base_url = f"https://{domain}/resource"
+        self.app_token = app_token
+
+    def get(self, resource_id, IdSensore, limit, filters=None):
+        """
+        Retrieve data from a Socrata dataset.
+        :param resource_id: The ID of the Socrata dataset.
+        :param filters: Optional filters to apply to the query.
+        :return: A list of records from the dataset.
+        """
+        url = f"{self.base_url}/{resource_id}.json"
+        params = {"$limit": limit,
+                  "idsensore": IdSensore,
+                 }
+
+        if filters:
+            params.update(filters)
+
+        headers = {}
+        if self.app_token:
+            headers["X-App-Token"] = self.app_token
+
+        response = requests.get(url, params=params, headers=headers)
+        if response.status_code == 200:
+            data = response.json()
+            return data
+
+        raise Exception(f"Failed to retrieve data. Status code: {response.status_code}")


 def read_data_online(dataset, sensore):
-    client = _connect()
-    return client.get(dataset, IdSensore=sensore)
+
+    client = SocrataClient('www.dati.lombardia.it', None)
+    limit = 1000000
+
+    try:
+        data = client.get(dataset, sensore, limit)
+        if data:
+            #print(json.dumps(data, indent=2))
+            return data
+        else:
+            print("No data found for the specified sensor.")
+            sys.exit(-1)
+    except Exception as e:
+        print(f"Error: {e}")
+        sys.exit(-1)


 def read_data_from_csv(datafile):
@ -65,7 +115,7 @@ def process(dati, sensore, csv):
        results_df["data"] = pd.to_datetime(results_df["data"])
        results_df = results_df.replace(-9999, np.nan)
    except:
-        print('\nERRORE: dati non disponibili per il sensore %s\n') % sensore
+        print('\nERRORE: dati non disponibili per il sensore %s\n' % sensore)
        traceback.print_exc()
        sys.exit(-1)
    results_df.sort_values(by=['data'], inplace=True)
@ -111,6 +161,7 @@ def plot_dataframe(dataframe):


 def list_of_csv_files(dir_name):
+    """ restituisce la lista dei files .zip presenti in una directory """
    saved = getcwd()
    os.chdir(dir_name)
    filelist = glob.glob('*.zip')
@ -119,6 +170,7 @@ def list_of_csv_files(dir_name):


 def parse_range(x):
+    """ espande un range di anni nel formato NNNN-NNNN restituendo una lista dei singoli anni """
    x = x.strip()
    if x.isdigit():
        yield str(x)
@ -130,6 +182,7 @@ def parse_range(x):


 def get_csv_dict(dict):
+    """ prende un dizionario dei files csv e assegna ad ogni anno un filename e una sigla id, restituendo un dict """
    d = {}
    for (k, v) in dict.items():
        filename, id = k, v
@ -140,7 +193,7 @@ def get_csv_dict(dict):
        elif match_single:
            years = [match_single.group()]
        else:
-            print("no match")
+            print("\nError: no match, the filename does not contain any year")
        for year in years:
            d.update({year: [filename, id]})
    return d
@ -192,6 +245,39 @@ def check_year_range(arg):
    return True


+def create_folder_if_not_exists(folder_path):
+    if not os.path.exists(folder_path):
+        try:
+            os.makedirs(folder_path)
+            print(f"Folder '{folder_path}' created successfully.")
+        except OSError as e:
+            print(f"Error creating folder '{folder_path}': {e}")
+    else:
+        print(f"Folder '{folder_path}' already exists.")
+
+
+def is_graphical_environment_active():
+    value = os.environ.get("DISPLAY")
+    if value is not None and value != "":
+        return True
+    else:
+        return False
+
+
+def is_remote_tty():
+    """
+    Check if the script is executed on a remote TTY.
+
+    Returns:
+        bool: True if running on a remote TTY, False if running locally.
+    """
+    term = os.environ.get('TERM')
+    if term is not None and (term.startswith('xterm') or term == 'ssh'):
+        return True
+    else:
+        return False
+
+
 def main():
    parser = argparse.ArgumentParser()
    parser.add_argument("--dataset", nargs='+', required=False,
@ -203,6 +289,7 @@ def main():
    args = parser.parse_args()

    try:
+        create_folder_if_not_exists(path_to_csv_files)
        csv_dict = get_csv_dict(csv_ambiente)
        csv_files = list_of_csv_files(path_to_csv_files)
        dati_csv = []
@ -226,21 +313,26 @@ def main():
        s = stazioni.get_stazioni()
        for sensore in datamerged.columns[1:]:
            location = s.loc[s['idsensore'] == sensore.split("-")[0], 'nomestazione'].iloc[0]
-            print('Valore medio per il sensore %s %s: %s' % (sensore, location, datamerged[sensore].mean().round(1)))
-        plot_dataframe(datamerged)
+            sensor_type = s.loc[s['idsensore'] == sensore.split("-")[0], 'nometiposensore'].iloc[0]
+            print('Valore medio per il sensore %s %s %s: %s' % (sensore, sensor_type, location, datamerged[sensore].mean().round(1)))
+        if is_graphical_environment_active() and not is_remote_tty():
+            plot_dataframe(datamerged)
    except KeyError:
        print("\nKeyError: forse hai specificato un dataset che non esiste ?\n"
              "i dataset sono disponibili per gli anni %s\n " % list(datasets_ambiente.keys()))
-        traceback.print_exc()
+        #traceback.print_exc()
+        sys.exit(-1)
    except KeyboardInterrupt:
        print("program terminated by user")
+        sys.exit(-1)
    except SystemExit:
        print("program terminated, bye")
+        sys.exit(-1)
    except:
        print("\nAn unhandled exception occured, here's the traceback!\n")
        traceback.print_exc()
        print("\nReport this to putro@autistici.org")
-        sys.exit()
+        sys.exit(-1)


 if __name__ == '__main__':
--- a/stazioni.py
+++ b/stazioni.py
@ -3,12 +3,39 @@
 import os.path
 import tabulate
 import pandas as pd
-from sodapy import Socrata
+import requests
+
+
+class SocrataClient:
+    def __init__(self, domain, app_token=None):
+        self.domain = domain
+        self.app_token = app_token
+
+    def get_data(self, resource_id, query=None, limit=None):
+        base_url = f"https://{self.domain}/resource/{resource_id}.json"
+        params = {'$limit': limit} if limit else {}
+        if query:
+            params['$query'] = query
+
+        headers = {}
+        if self.app_token:
+            headers['X-App-Token'] = self.app_token
+
+        response = requests.get(base_url, params=params, headers=headers)
+
+        if response.status_code == 200:
+            data = response.json()
+            return data
+        else:
+            print(f"Error {response.status_code}: {response.text}")
+            return []
+
+    def get_dataframe(self, resource_id, query=None, limit=None):
+        data = self.get_data(resource_id, query=query, limit=limit)
+        df = pd.DataFrame(data)
+        return df


-def _connect():
-    client = Socrata("www.dati.lombardia.it", None)
-    return client


 def get_stazioni(offline=False):
@ -20,8 +47,8 @@ def get_stazioni(offline=False):
                                  "Limiti amministrativi 2015 delle province di Regione Lombardia"], inplace=True)
        stazioni_df.columns = [x.lower() for x in stazioni_df.columns]
    else:
-        client = _connect()
-        stazioni = client.get("ib47-atvt")
+        client = SocrataClient("www.dati.lombardia.it", None)
+        stazioni = client.get_data("ib47-atvt")
        stazioni_df = pd.DataFrame.from_records(stazioni)
        stazioni_df.drop(columns=[":@computed_region_6hky_swhk", ":@computed_region_ttgh_9sm5", "utm_est",
                                  "utm_nord", "storico", "idstazione", "lat", "lng", "location"], inplace=True)
Author	SHA1	Message	Date
putro	6b50d67c0b	merged replace_sodipy	2023-09-20 13:27:34 +02:00
putro	8b0c518be1	added some description to functions	2020-04-17 16:43:36 +02:00
putro	f4b7e6a887	small fix	2020-04-17 16:33:41 +02:00