forked from ampinzonv/covid19-CO
-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathmain.py
268 lines (211 loc) · 9.36 KB
/
main.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""
Created on Sat Apr 4 14:18:04 2020
Bioinformatics and Systems Biology Group
Institute for Genetics
National University of Colombia
Please see contributors on GitHub
"""
import plotly.offline as pyo
import matplotlib.dates as mdates
import pandas as pd
import requests
from funciones import plotme, percentage
#Teniendo en cuenta que la informacion del Covid-19 se encuentra en la web, se referencia la data para que esta este actualizada
url_generales = 'https://e.infogram.com/api/live/flex/bc384047-e71c-47d9-b606-1eb6a29962e3/523ca417-2781-47f0-87e8-1ccc2d5c2839?'
#Debido a que la información no proviene de un formato dado, es necesario definirla como texto y aprovechar
#que esta viene en formato py, por ende se evalua ese texto
json_generales = eval(requests.get(url_generales).text)
#Se seleccionan unicamente el dataframe del historico y se define como dataframe
# Los datos de el INS pueden estar desactualizados, se actualizan confome a la informacion de datos abiertos
df_pacientes = pd.read_csv('https://www.datos.gov.co/api/views/gt2j-8ykr/rows.csv?accessType=DOWNLOAD')
data = json_generales["data"][0] # Hoja de casos acumulados
df_generales = pd.DataFrame(data=data[1:], columns=data[0])
#Renombrar algunas columnas
df_pacientes.rename(columns = {'atención':'Atencion',
'Ciudad de ubicación':'Ciudad',
'Departamento o Distrito ':'Departamento',
'Edad':'Edad',
'Fecha de diagnóstico':'Fecha',
'Fecha de muerte':'Fecha_Muerte',
'Fecha recuperado':'Fecha_Recuperado',
'FIS':'FIS',
'ID de caso':'ID',
'País de procedencia':'Procedencia',
'Sexo':'Sexo',
'Tipo':'Tipo'}, inplace = True)
df_generales.rename(columns = {'':'Fechas',
'Fallecidos acumulados':'Fallecidos',
'Positivos acumulados':'Infectados',
'Recuperados acumulados':'Recuperados'}, inplace = True)
f = df_pacientes[['Fecha']].drop_duplicates()
#Se define el formato de las fechas como datetime
df_pacientes['Fecha']=pd.to_datetime(df_pacientes['Fecha'].str.slice(start=0,stop=10), infer_datetime_format=True)
df_pacientes['Tipo']=df_pacientes['Tipo'].str.lower()
#Se realizan los conteos por fecha y tipo
df_cont = df_pacientes[['Fecha','Tipo','ID']].groupby(['Fecha','Tipo']).count().add_suffix('_Count').reset_index()
# Se realizan conteos por tipo relacionado, importado, en estudio y totales
allRel = df_cont[df_cont['Tipo'] == 'relacionado']
allImp = df_cont[df_cont['Tipo'] == 'importado']
allEst = df_cont[df_cont['Tipo'] == 'en estudio']
allCasos = df_cont[['Fecha','ID_Count']].groupby(['Fecha']).sum().reset_index()
#---------- DATOS BASICOS ----------
print ("----------------")
c = sum(allCasos['ID_Count'])
i = sum(allImp['ID_Count'])
e = sum(allEst['ID_Count'])
r = sum(allRel['ID_Count'])
print('Casos Totales: ' + str(c))
print('Casos Importados: ' + str(i) + "(" + str(percentage(i,c)) + "%)")
print('Casos Relacionados:' + str(r) + "(" + str(percentage(r,c)) + "%)")
print('Casos en Estudio: ' + str(e) + "(" + str(percentage(e,c)) + "%)")
#-------------- RELACIONADOS - IMPORTADOS - EN ESTUDIO ------------------------
trace1 = {'x': allImp['Fecha'],
'y': allImp['ID_Count'],
'mode' : "lines+markers",
'name' : 'Contagio en el exterior',
'marker' : dict(color = 'DarkSlateGrey')
} ;
trace2 = {'x': allRel['Fecha'],
'y': allRel['ID_Count'],
'mode' : "lines+markers",
'name' : 'Contagio en Colombia',
'marker' : dict(color = '#ff6361')
} ;
trace3 = {'x': allEst['Fecha'],
'y': allEst['ID_Count'],
'mode' : "lines+markers",
'name' : 'En estudio',
'marker' : dict(color = '#ffa600')
} ;
data = [trace1, trace2, trace3];
layout = dict(title = 'Casos venidos del extranjero vs. contagios locales', xaxis= dict(title= 'Fecha',ticklen= 5,zeroline= False)
)
fig = dict(data = data, layout = layout)
pyo.plot(fig, filename='import_local.html')
#-------------- ACUMULADO E INCREMENTO POR FECHA --------------------
#Acumulado es igual a los casos de hoy mas los acumulados hasta ayer.
allCasos["acum"]= allCasos["ID_Count"].cumsum(axis=0)
#Incremento es igual los casos de hoy menos los casos de ayer.
allCasos["inc"] = allCasos["ID_Count"].diff(1)
# --- PLOTEAR
#Crear los parámetros para cada "trace". Basicamente eje Y.
trace1 = {'x': allCasos["Fecha"],
'y': allCasos["acum"],
'mode' : "lines+markers",
'name' : 'Acumulado',
'marker' : dict(color = 'DarkSlateGrey')
} ;
trace2 = {'x':allCasos["Fecha"],
'y':allCasos["inc"],
'mode' : "lines+markers",
'name':'Incremento',
'marker' : dict(color = '#ff6361')
};
trace3 = {'x':allCasos["Fecha"],
'y':allCasos["ID_Count"],
'mode' : "lines+markers",
'name':'Casos',
'marker' : dict(color = '#ffa600')
};
data = [trace1, trace2, trace3];
#print(data)
layout = dict(title = 'Progresión de casos en Colombia desde Marzo 6 del 2020 a la fecha', xaxis= dict(title= 'Fecha',ticklen= 5,zeroline= False)
)
fig = dict(data = data, layout = layout)
pyo.plot(fig, filename='progresion.html')
#-------------- MODELO SIR --------------------
df_generales['Fechas'] = pd.to_datetime(df_generales['Fechas'], format='%d/%m')+pd.offsets.DateOffset(years=120)
df_generales['Infectados'] = pd.to_numeric(df_generales['Infectados'])
df_generales['Recuperados'] = pd.to_numeric(df_generales['Recuperados'])
df_generales['Fallecidos'] = pd.to_numeric(df_generales['Fallecidos'])
df_generales.fillna(0, inplace=True)
# poblacion colombiana
N = 49070000 # 49,07 millones
# Obtiene los acumulados para cada factor del modelo
df_generales['I'] = df_generales['Infectados']
df_generales['R'] = df_generales['Recuperados'] + df_generales['Fallecidos']
df_generales['S'] = N - df_generales['I'] - df_generales['R']
# Calcula la derivada de los acumulados
df_generales["puntoS"] = df_generales.S - ([0] + df_generales.iloc[:-1]["S"].tolist())
df_generales["puntoI"] = df_generales.I - ([0] + df_generales.iloc[:-1]["I"].tolist())
df_generales["puntoR"] = df_generales.R - ([0] + df_generales.iloc[:-1]["R"].tolist())
import SIR
beta_gamma, intercept = SIR.RegresionLineal(df_generales['I'].to_list(), df_generales['puntoI'].to_list())
print ("(beta-gamma) found by gradient descent: %f" %(beta_gamma[0]))
# Grafica
I = df_generales['I'].to_list()
trendX = [I[0], I[-1]]
trendY = [(I[0]*beta_gamma[0])+intercept, (I[-1]*beta_gamma[0])+intercept]
trend = {'x': trendX,
'y': trendY,
'mode' : "lines",
'name' : 'tendencia',
'marker' : dict(color = '#ffa600')
} ;
scatter = {'x': df_generales['I'],
'y': df_generales['puntoI'],
'mode' : "markers",
'name' : 'infectados',
'marker' : dict(color = '#ff6361')
} ;
data = [scatter, trend];
layout = dict(title = 'Infectados acumulados vs nuevos infectados', xaxis= dict(title= 'Infectados acumulados',ticklen= 5,zeroline= False)
)
fig = dict(data = data, layout = layout)
pyo.plot(fig, filename='acu_nuevos.html')
# Encontrando gamma
gamma, _ = SIR.RegresionLineal(df_generales['I'].to_list(), df_generales['puntoR'].to_list())
print ("(gamma) found by gradient descent: %f" %(gamma[0]))
# Grafica
trendX = [I[0], I[-1]]
trendY = [(I[0]*gamma[0])+_, (I[-1]*gamma[0])+_]
trend = {'x': trendX,
'y': trendY,
'mode' : "lines",
'name' : 'tendencia',
'marker' : dict(color = '#ffa600')
} ;
scatter = {'x': df_generales['I'],
'y': df_generales['puntoR'],
'mode' : "markers",
'name' : 'Recuperados',
'marker' : dict(color = '#ff6361')
} ;
data = [scatter, trend];
layout = dict(title = 'Infectados acumulados vs nuevos recuperados', xaxis= dict(title= 'Infectados acumulados',ticklen= 5,zeroline= False)
)
fig = dict(data = data, layout = layout)
pyo.plot(fig, filename='acumulados_vs_nuevos_recuperados.html')
beta = beta_gamma[0] - gamma[0]
R_0 = beta / gamma
print ("(beta) found by gradient descent: %f" %(beta))
print ("(R_0) found by gradient descent: %f" %(R_0))
"""
# Coeficiente de transmicion beta
# y Tasa de recuperacion gama
# se obtienen por gradient descent
# Calculo de derivadas: tasa de cambio
punto_S = -beta * Suceptibles * Infectados / N
punto_I = (beta * Suceptibles * Infectados / N) - (gama * Infectados)
punto_R = gama * Infectados
# NOTA: punto_S + punto_I + punto_R = 0
"""
trace1 = {'x': df_generales['Fechas'],
'y': df_generales['R'],
'mode' : "lines+markers",
'name' : 'Recuperados + Fallecidos',
'marker' : dict(color = 'DarkSlateGrey')
} ;
trace2 = {'x': df_generales['Fechas'],
'y': df_generales['I'],
'mode' : "lines+markers",
'name':'Infectados',
'marker' : dict(color = '#ff6361')
};
data = [trace1, trace2];
layout = dict(title = 'Recuperados, Infectados', xaxis= dict(title= 'Fecha',ticklen= 5,zeroline= False)
)
fig = dict(data = data, layout = layout)
pyo.plot(fig, filename='rec_inf.html')