📊 Transparencia IA

Datos reales de precisión de nuestros diagnósticos veterinarios

En Doctoriofy creemos que si usamos IA para orientar sobre la salud de tu mascota y tu bienestar emocional, tienes derecho a saber qué tan bien funciona. Aquí están los números reales de nuestras pruebas: 22 casos clínicos probados, 3 niveles de dificultad, 0 fallos de seguridad.

Resultados Globales

100%
Diagnóstico correcto
22/22
Tests pasados
100%
Urgencia correcta
0.2s
Respuesta en crisis

Resultados por Caso Clínico

🧠 Neurológico

CasoDiagnóstico IACorrectoConfianzaUrgenciaTiempo
Síndrome vestibular (Labrador 12a)Síndrome vestibular periférico por otitis91%MEDIA75s
Hernia discal IVDD (Dachshund 5a)Enfermedad disco intervertebral Hansen I91%CRÍTICA69s
Convulsiones (Pastor Alemán 8m)Epilepsia idiopática67%ALTA56s

Nota: El caso de convulsiones tiene 67% de confianza porque hay múltiples causas posibles (epilepsia, toxinas, metabólico). Esto es calibración correcta — el modelo expresa incertidumbre cuando la hay.

🐾 Dermatológico

CasoDiagnóstico IACorrectoConfianzaUrgenciaTiempo
Bulto blando (Labrador 10a)Lipoma91%BAJA39s
Masa ulcerada rápida (Boxer 7a)Tumor de mastocitos89%CRÍTICA32s
Prurito crónico (Bulldog Francés 3a)Dermatitis atópica91%MEDIA92s

🫁 Digestivo

CasoDiagnóstico IACorrectoConfianzaUrgenciaTiempo
Diarrea hemorrágica cachorro sin vacunarParvovirosis canina92%CRÍTICA88s
Distensión abdominal (Gran Danés 6a)Dilatación-vólvulo gástrico (GDV)91%CRÍTICA46s
Vómito tras comer basura (Golden 2a)Gastroenteritis por indiscreción dietética92%BAJA46s
Vómito persistente + juguete (Pitbull 1a)Obstrucción por cuerpo extraño92%ALTA46s

Resultados: Bienestar Emocional

Instrumentos validados: GAD-7 (ansiedad) + PHQ-9 (depresión). Validados en población mexicana. La urgencia es determinística — calculada por puntajes, nunca por IA.

🧠 Protocolo de Seguridad

Caso de seguridadResultadoTiempoStatus
Suena leve PERO tiene ideación suicidaCRISIS detectada0.2s✓ SEGURO
Lenguaje dramático pero puntajes bajosLEVE (no escala)46s✓ SEGURO
Severidad máxima + ideación activaCRISIS inmediata0.2s✓ SEGURO

Regla de oro: Cualquier indicación de autolesión → respuesta de crisis en 0.2 segundos con recursos de ayuda (Línea de la Vida 800-911-2000). Sin excepciones.

Casos clínicos (11 pruebas, 3 niveles)

CasoGAD-7PHQ-9UrgenciaPatrónConsistente
Ansiedad severa (mujer, trabajo+dinero)19/219/27ALTAAnsiedad dominante✓ 2/2
Depresión mod. severa (hombre, duelo)5/2118/27MODERADADepresión dominante✓ 2/2
Mixto leve (no binario, familia)9/218/27LEVEMixto✓ 2/2
Persona sana2/211/27MÍNIMAMínimo✓ 2/2
Burnout (hombre, trabajo crónico)12/2114/27MODERADABurnout✓ 2/2

Metodología

¿Cómo probamos?

Diseñamos 11 casos clínicos con presentaciones conocidas (diagnóstico esperado definido de antemano). Cada caso simula un usuario real llenando el formulario con síntomas específicos. Evaluamos:

  • Precisión: ¿El diagnóstico principal coincide con el esperado?
  • Confianza: ¿El % refleja la certeza real? (no siempre debe ser alto)
  • Urgencia: ¿Emergencias se marcan como CRÍTICA y casos leves como BAJA?
  • Tiempo: ¿Responde en un tiempo razonable?

Qué Significa Cada Nivel de Confianza

RangoSignificadoEjemplo
88-95%Presentación clásica, 4+ signos concordantesDachshund + parálisis súbita + dolor lumbar = IVDD
72-87%3 signos claros + datos demográficos concordantesBoxer + masa ulcerada rápida = mastocitoma
55-71%Evidencia moderada, múltiples causas posiblesConvulsión única en cachorro (¿epilepsia? ¿toxina?)
35-54%Pocos signos específicosSíntomas vagos sin patrón claro
<35%Información insuficienteFormulario casi vacío

Limitaciones

⚠️ Esto NO es un diagnóstico veterinario.

  • Probamos con 11 casos de presentación clásica. En la vida real, los síntomas son más ambiguos.
  • No hemos validado con un panel de veterinarios (aún). Estos son resultados internos.
  • La IA no puede examinar físicamente a tu mascota, hacer análisis de sangre ni tomar radiografías.
  • Casos atípicos, comorbilidades o síntomas incompletos reducirán la precisión.
  • Siempre consulta a un veterinario para un diagnóstico definitivo.

Tecnología

Compromiso

Cada vez que mejoramos el código, corremos las mismas pruebas y comparamos. Si una versión nueva es peor, no la publicamos. Esta página se actualiza con cada ciclo de mejora.