El 16 de abril de 2025, cuando la mayoría de España ya estaba preparando las maletas para estas vacaciones de Semana Santa, se presentó OpenAI o3, su modelo más avanzado en razonamiento hasta la fecha. Diseñado para abordar tareas complejas que requieren un análisis detallado, o3 representa un salto cualitativo en la evolución de los modelos de lenguaje.
Razonamiento prolongado: pensar antes de responder
Una de las características más destacadas de OpenAI o3 es su capacidad para «pensar durante más tiempo antes de responder». Esta habilidad permite al modelo abordar problemas complejos con mayor profundidad, descomponiendo las tareas en pasos lógicos y corrigiéndose durante el proceso de razonamiento.
Este enfoque se traduce en respuestas más precisas y estructuradas, especialmente en tareas que requieren múltiples pasos lógicos. Por ejemplo, en evaluaciones como el Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI), OpenAI o3 ha demostrado una precisión tres veces superior a la de su predecesor, o1.
Uno de los ejemplos más ilustrativos compartidos por OpenAI en su anuncio oficial del modelo o3 es el que aparece en la siguiente imagen. En él, se plantea un problema matemático avanzado que requiere construir un polinomio de grado 19 con propiedades específicas, y calcular su valor en un punto. Lo interesante no es solo la solución final, sino el proceso que sigue el modelo: analiza restricciones, explora caminos posibles, descarta opciones no válidas, aplica teoremas y patrones clásicos, y finalmente propone una solución fundamentada.
Este tipo de respuesta encadena múltiples pasos lógicos con una coherencia que demuestra razonamiento prolongado, una de las capacidades clave mejoradas en OpenAI o3. Como puede observarse, el modelo no se limita a responder rápidamente, sino que muestra una comprensión profunda del problema y construye la solución a través de una serie de decisiones argumentadas.

Integración multimodal: pensar con imágenes
Otra innovación significativa de OpenAI o3 es su capacidad para integrar información visual directamente en su proceso de razonamiento. Esto significa que puede analizar bocetos, diagramas y otros elementos visuales como parte de su análisis, incluso manipulando imágenes mediante zoom o rotación para mejorar la interpretación.
Esta capacidad multimodal amplía significativamente el rango de aplicaciones de OpenAI o3, haciéndolo útil en campos como la educación, la ingeniería y el diseño, donde la interpretación de información visual es crucial.
Un ejemplo perfecto de esta nueva capacidad multimodal de o3 es el análisis de una imagen con barcos en alta mar, tal como se muestra en el artículo original de OpenAI.
Ante la pregunta de identificar el barco más grande visible y predecir su destino, el modelo primero analiza la imagen y reconoce que los barcos estaban parcialmente fuera del encuadre. A continuación, propone hacer zoom para mejorar la visibilidad, identifica un petrolero de casco rojo como el más grande, y plantea que podría ser necesario aumentar la resolución para leer su nombre.
Esta secuencia demuestra cómo OpenAI o3 razona paso a paso con elementos visuales, formula suposiciones, evalúa limitaciones (como la calidad de imagen) y decide acciones posteriores. No se limita a describir lo que ve, sino que «piensa con la imagen», integrándola como parte de su proceso cognitivo.

Uso autónomo de herramientas: hacia una IA más proactiva
o3 también destaca por su capacidad para utilizar y combinar todas las herramientas disponibles en ChatGPT, incluyendo la navegación web, el análisis de archivos, la generación de imágenes y el uso de Python. Esta integración permite al modelo ejecutar tareas de manera autónoma y eficiente, acercándose a la visión de un ChatGPT más proactivo y útil.
Esta capacidad transforma por completo la forma en la que las empresas pueden automatizar tareas cognitivas, desde la generación de informes hasta el análisis de grandes bases de datos, pasando por la resolución de problemas técnicos de alto nivel.
Rendimiento en benchmarks: superando a la competencia
En términos de rendimiento, o3 establece nuevos estándares en pruebas como Codeforces, SWE-bench y MMMU.

Codeforces es una plataforma reconocida internacionalmente para competiciones de programación, que plantea problemas algorítmicos complejos similares a los que se encuentran en competiciones como las Olimpiadas Internacionales de Informática (IOI). La puntuación se mide en escala ELO, un sistema clásico utilizado para evaluar la habilidad relativa de los participantes, también presente en ajedrez competitivo.
El modelo o3 logra una puntuación de 2706, lo que lo posiciona por encima del 99,8% de los participantes humanos en la plataforma Codeforces. Este resultado es impresionante, ya que implica que OpenAI o3 supera a prácticamente todos los programadores competitivos humanos, resolviendo problemas algorítmicos de alto nivel de dificultad.
WE-Bench (Software Engineering Verified Benchmark) evalúa la capacidad de un modelo de lenguaje para comprender y corregir errores reales en proyectos de software de código abierto. La prueba se basa en tareas reales extraídas de repositorios de GitHub, incluyendo la comprensión de bugs, pull requests y documentación técnica. La métrica clave es la precisión (accuracy): porcentaje de errores corregidos correctamente por el modelo.
Con una precisión del 69,1%, o3 ofrece una mejora de más de 20 puntos porcentuales respecto al modelo o1. Esta diferencia no solo indica que OpenAI o3 es mejor escribiendo o corrigiendo código, sino que comprende el contexto funcional del software: desde entender las relaciones entre clases y funciones hasta ajustar lógica algorítmica sin introducir errores nuevos.
MMMU (Massive Multitask Multimodal Understanding) es un benchmark que incluye preguntas de tipo examen universitario, muchas de ellas con componentes visuales como gráficos, diagramas o ilustraciones. Abarca múltiples disciplinas (matemáticas, física, medicina, historia del arte, etc.) y combina razonamiento textual con interpretación visual, algo fundamental para la evaluación de IA generalista.
El modelo o3 alcanza un 82,9% de precisión, demostrando su capacidad para comprender y razonar sobre materiales visuales de alta complejidad académica. Esto incluye desde resolver problemas geométricos o interpretar resonancias magnéticas hasta analizar tablas estadísticas o mapas conceptuales.
El modelo o3 lidera en los tres, lo que sugiere que estamos ante un sistema que no solo domina el lenguaje, sino que empieza a mostrar señales de comprensión técnica profunda, habilidades de análisis visual, y razonamiento generalista multimodal. Es decir, se está acercando a las capacidades que cabría esperar de una inteligencia artificial general avanzada (AGI).
Un ejemplo para una empresa hostelera usando OpenAI o3
Uno de los ejemplos más sorprendentes del uso del modelo OpenAI o3 es el caso simulado de una cadena hotelera boutique con sede en Madrid, Barcelona y Lisboa, que plantea su expansión hacia nuevas ciudades en Europa y Asia en 2026.
El modelo recibió una petición abierta: identificar las ubicaciones más prometedoras teniendo en cuenta factores como la ocupación hotelera, el crecimiento turístico, la estacionalidad y los riesgos regulatorios. Lo interesante no es solo la respuesta, sino el proceso de razonamiento prolongado, que se extendió durante más de dos minutos.
En ese tiempo, OpenAI o3 razonó paso a paso: identificó qué indicadores necesitaba, cruzó datos de ocupación y RevPAR (Revenue per Available Room), contrastó informes de CBRE, STR y organismos turísticos oficiales, y fue ajustando sus hipótesis a medida que obtenía información más detallada ciudad por ciudad. Analizó destinos como Budapest, Osaka, Dubái, Seúl, Chiang Mai o Varsovia, y solo recomendó aquellos con proyecciones de crecimiento sostenido, pipeline de oferta limitada y alto potencial cultural para hoteles de nicho.



En su análisis final, el modelo seleccionó Budapest como la mejor ubicación en Europa por su fuerte subida en ADR y RevPAR y escasez de oferta futura, y Seúl como la mejor opción en Asia, por su diversidad de flujos turísticos y apoyo gubernamental a proyectos lifestyle. Incluso propuso detalles tácticos para aterrizar la expansión: abrir en el primer trimestre de 2026 para aprovechar eventos clave como la Expo y la Fashion Week, buscar edificios patrimoniales con operaciones de sale-lease-back, y mantener paneles de seguimiento con datos de movilidad y OTAs. Esta respuesta no solo demuestra la potencia técnica de OpenAI o3, sino también su capacidad de actuar como consultor estratégico con visión de negocio real.



El modelo o3 de OpenAI no es solo una evolución técnica: es un cambio de paradigma en cómo entendemos la inteligencia artificial aplicada a contextos reales. Con su capacidad de razonamiento prolongado, integración multimodal y autonomía en el uso de herramientas, o3 demuestra ser más que un asistente conversacional: es un socio estratégico capaz de resolver problemas complejos, generar ideas, analizar datos y aportar recomendaciones fundamentadas en múltiples fuentes. Desde la programación de alto nivel hasta decisiones de expansión empresarial, OpenAI o3 marca un antes y un después en la forma en que las organizaciones pueden apoyarse en la IA para tomar decisiones más rápidas, inteligentes y efectivas.
¿Quieres incorporar IA en tus procesos empresariales?
Si estás valorando cómo la inteligencia artificial puede ayudarte a optimizar decisiones, automatizar tareas complejas o potenciar el análisis estratégico de tu negocio, podemos ayudarte a dar el siguiente paso. Rellena el formulario de contacto de nuestra web y uno de nuestros expertos se pondrá en contacto contigo para evaluar juntos tus necesidades y explorar cómo soluciones como OpenAI o3 pueden integrarse en tu organización.