home · contact · privacy
De-hardcode infections table path from enhance_table.py.
[berlin-corona-table] / enhance_table.py
index 3d3ec779d0a6d77ebcae2d6ea0d90ef3bda493b4..2b6bb8dc8ff7fcc4f51cb279a44671294f4a0d79 100755 (executable)
@@ -1,5 +1,11 @@
 #!//usr/bin/env python3
 
+import sys
+if len(sys.argv) != 2:
+    print('Expecting infections table file path as only argument.')
+    exit(1)
+infections_table = sys.argv[1]
+
 # District population numbers as per Wikipedia.
 district_pops = {
   'CW': 342332,
@@ -17,11 +23,11 @@ district_pops = {
   'sum': 3754418,
 }
 
-f = open('daily_infections_table.txt', 'r')
+f = open(infections_table, 'r')
 lines = f.readlines()
 f.close()
 
-# Parse first table file line for the names and order of districts. 
+# Parse first table file line for the names and order of districts.
 db = {}
 sorted_districts = []
 for header in lines[0].split():
@@ -40,11 +46,14 @@ for line in lines[1:]:
         db[district][date] = {'new_infections': int(district_data)}
 sorted_dates.sort()
 
+# In LaGeSo's data, the last "district" is actually the sum of all districts /
+# the whole of Berlin.
+#
 # Fail on any day where the "sum" district's new infections are not the proper
 # sum of the individual districts new infections.  Yes, sometimes Lageso sends
 # data that is troubled in this way.  It will then have to be fixed manually in
 # the table file, since we should have a human look at what mistake was
-# probably made. 
+# probably made.
 for date in sorted_dates:
     sum_district = sorted_districts[-1]
     day_sum = 0