lunes, 4 de febrero de 2008

El web service se reventó.

O no supimos configurar el HttpRuntime
O lo encargamos de lo que no era

El webservice protagonista de este post fue creado y usado para lo que no debería ser. Exponía una funcionalidad de una aplicación web administradora de contenidos. Como esa era muy compleja "pa meterle la mano" entonces la dejaron intacta, solo que le "samparon" el web service, para que la aplicación propia pudiese usar el dichoso administrador de contenidos.

En teoría funcionaba bien. Pero ante cargas significativas: "The thread have been aborted". Y nadie sabía qué era. Mejor dicho, se "totiaba". Entonces me llamaron a ver que era. Y lo primero que observé, es que el pobre webservice exponía unas operaciones que operaban sobre la base de datos. Y en general eran operaciones costosas. Pero lo peor, es que siempre el webservice tenía que quedarse esperando la respuesta del servidor de DB.

"Eso es el timeout del webservice" dije.
"Si, pero ya le pusimos hasta 5000 horas y nada!!"
Ouch!!!

Entonces tratemos de optimizar las operaciones de la DB.
Le pasé el profiler, el DBEngine Tunning Advisor, implementé y borré índices y en efecto. La vaina mejoró.
Operaciones de 9 minutos pasaron a 3 y en otros casos operaciones de 3 min pasaron a 1 seg (y eso porque el reporte no mostraba menos de 1 seg)

Pero llegamos al punto en que por más optimización que hicimos, el error seguía pasando y el thread seguía siendo abortado.

Cuál thread? Pues el del webservice. Entonces insistí: "Eso tiene que ser algún timeout"
El sujeto directamente implicado entonces muy juicioso esa noche googleó y googleó hasta encontrar un nuevo parámetro de timeout. Y tome!!! "Le pegó al perrito" (Lamento no haber sido yo, así la recompensa para mí hubiese sido mayor. Pero me agrada haberlo guiado por el camino de la luz... veo una luz veo una luz!!!)

El httpruntime es un parámetro de configuración en el webconfig y jugar con sus valores puede ser catastrófico o genial. (En este punto cuando he nombreado web.config obvio que sabrán que estoy hablando de asp.net. especficamente del 2.0).

Señores, se los presento aquí.

Allí encontramos como atributo a executionTimeOut y fue el que le pusieron como en 5000 y nada. Por qué?
Uno diría que aquí es donde le puede decir al webservice que espere más antes de "morirse". En efecto así es. Lo que pasa es que con el framework 2.0 vino nuevo otro atributo: shutdownTimeout. El primer atributo aplica sobre la aplicación como tal. Pero el segundo aplica sobre el worker process. Así que si está muy bajo para lo que uno quiere, el worker process es "bajado" por ASP.net cuando el tiempo expira y adivinen que pasa "The thread has been aborted".

Lo pusieron en 1000 y por fin pudieron hacer su prueba completa!!!

Concluyendo: Para evitarse problemas, no ponga a los webservices a esperar respuestas a trabajos completos. Esto margina el rendimiento de la red, y en general de todos los recursos del sistema. Eso mándelos a ejecutar algo y que se desprendan de una. Y luego ponga un observer a que mire si el otro ya acabó el trabajo. O quizá mantenga otro tipo de suscripción.

Si ya la embarró y no hay tiempo para cambios o definitivamente la terquedad o condiciones del negocio no permiten más, acuda al httpruntime y sus dos timeouts; esto puede apagar el incendio.

No hay comentarios: