./Catálogo
El Caos Categorizado.
En enero de 2026, el ecosistema de inteligencia artificial es un torbellino de innovación constante. Nuevos modelos frontier emergen casi mensualmente, impulsados por la competencia global entre Occidente (EE.UU. y aliados), Oriente (principalmente China) y contribuciones crecientes de Europa, Eurasia y el Sur Global. Este catálogo agrupa las principales plataformas y modelos fundacionales activos, clasificándolos por capacidades dominantes para facilitar la navegación en un mercado saturado.
Este panorama refleja una carrera bipolar (EE.UU.-China) con Europa aportando open-source y el Sur Global ganando terreno en adopción accesible.
CATEGORIAS
01. Narrow o Especializados
Estos modelos destacan en dominios concretos, ofreciendo eficiencia y precisión superior en tareas delimitadas.
Occidente (EE.UU.): Claude Opus 4.5 (Anthropic) – Excelente en coding y análisis de código masivo. Grok 4.1 (xAi) – Fuerte en math y reasoning en tiempo real.
Oriente (China): DeepSeek V3.2 / R1 (DeepSeek) – Líder en coding y math a bajo costo; eficiencia algorítmica revolucionaria.
Europa: Mistral Medium 3 (Mistral AI, Francia) – Especializado en multilingual y coding europeo.
Sur Global / Otros: Falcon-H1R (TII, Emiratos Árabes) – Compacto y fuerte en reasoning para edge computing y robotics.
02. Agentes y Agentic Ai
Plataformas y modelos diseñados para autonomía: planificación, uso de herramientas externas y ejecución multi-paso.
Occidente: Agentforce (Salesforce), Microsoft Copilot / Power Automate, Vertex Ai Agent Builder (Google Cloud), AWS Bedrock Agent Core.
Frameworks open-source: LangChain/LangGraph, CrewAo, AutoGen.
Oriente: Integraciones en Alibaba Cloud y Huawei Ascend para agentes escalables en entornos estatales.
Otros: Emergent, Botpress – Plataformas low-code para agentes enterprise.
03. Multimodales
Modelos que razonan nativamente sobre texto, visión, audio y vídeo, acercándose a una percepción "humana".
Occidente: Gemini 3 Pro (Google) – Líder en integración multimodal y contexto largo (1M+ tokens). GPT-5.2 (OpenAI) – Multimodal avanzado con voice y video en tiempo real.
Oriente: Qwen multimodal variants (Alibaba), Ernie multimodal (Baidu).
Europa: Pixtral Large / Mistral multimodal (Mistral Ai).
Otros: NVIDIA Cosmos / Nemotron multimodal – Fuerte en physical Ai y robotics.
04. Generalistas / Frontier
Los modelos "todo terreno" que dominan leaderboards globales (LMArena, GPQA, SWE-bench).
Occidente (EE.UU.):
Gemini 3 Pro (Google DeepMind) – Líder actual; excelencia multimodal y reasoning.
Claude Opus 4.5 (Anthropic) – Mejor en coding y escritura segura/nuanciada.
GPT-5.2 (OpenAi) – Versátil; fuerte en speed y math profundo.
Grok 4.1 (xAi) – Integración real-time; creativo y bajo hallucination.
Europa:
Mistral Large 3 (Mistral AI) – Eficiente, multilingual y MoE.
Oriente (China):
DeepSeek-R1 (DeepSeek) – Costo bajo; rivaliza closed-source en reasoning.
Qwen 3 (Alibaba) – Multimodal y open-weight fuerte.
Kimi K2 (Moonshot Ai) – Avanzado en MoE open-source.
Sur Global / Eurasia:
Falcon series (TII, EAU) – Reasoning eficiente para edge. Este panorama refleja una carrera bipolar (EE.UU.-China) con Europa aportando open-source y el Sur Global ganando terreno en adopción accesible (ej. DeepSeek en África y Latinoamérica).
TOP 3 por CATEGORIA
Narrow (IA estrecha/especializada)
Modelos enfocados en tareas específicas (ej. coding puro, math, narrow domains) sin ser generalistas.
Claude Opus 4.5 Thinking (Anthropic) Líder absoluto en coding real (80.9% SWE-bench Verified), agentic narrow tasks y precisión sin alucinaciones. Ideal para devs/profesionales que necesitan fixes en GitHub o flujos especializados.
DeepSeek V3.2 / R1 (DeepSeek) Dominio en math/coding barato y eficiente (top en costos/performance). Excelente para narrow STEM tasks, open-source-ish y disruptivo en precio.
GPT-5.2 Pro (OpenAi) Fuerte en razonamiento matemático/científico (100% AIME, top GPQA). Muy preciso en narrow knowledge work profesional.
Agentic (Agentes IA autónomos)
Modelos que planifican, usan tools, ejecutan multi-step y actúan con autonomía (ej. SWE-bench agentic, Terminal-Bench, tool use).
Claude Opus 4.5 Thinking (Anthropic) #1 en agentic coding y autonomía real (top LMArena WebDev, SWE-bench agentic). Maneja workflows largos sin romperse, memory persistente y tool chaining excelente.
Gemini 3 Pro (Google) Muy fuerte en agentic multimodal + long context (1M+ tokens). Integra tools nativos y ecosistema Google para agents prácticos.
GPT-5.2 (OpenAI) Top en razonamiento agentic complejo (líder AA Index agents pillar). Buen tool use y planning, aunque algo más caro.
Multimodal (Texto + Imagen + Video + Audio)
Modelos nativos que procesan y generan en múltiples modalidades sin hacks.
Gemini 3 Pro (Google) Rey indiscutible: native multimodal (video/audio/imagen/texto), 1M-2M context, top en LMArena Vision y prompt adherence. Maneja horas de video o archivos masivos.
GPT-5.2 Pro (OpenAI) Muy sólido en multimodal (texto + imagen + audio/video), fuerte en integración y razonamiento cross-modal.
Grok 4.1 (xAi) Bueno en multimodal + real-time (integra X data), creatividad visual y bajo hallucination en mixed inputs.
Frontier (Generalistas / más potentes y versátiles)
Los "todo terreno" frontier-level (razonamiento, coding, multimodal, agents, etc.).
Gemini 3 Pro (Google) Líder en preferencia humana (LMArena Text #1), versatilidad extrema, multimodal nativo y long context. "King of Versatility" para uso diario/profesional.
GPT-5.2 (OpenAI) #1 en benchmarks crudos (líder Artificial Analysis v4.0 overall, top reasoning/math/science). Muy fuerte en professional knowledge work.
Claude Opus 4.5 (Anthropic) Top en coding/agentic + tono natural/ético. Excelente para tareas complejas largas y consistentes.
Glosario de catálogo “El caos categorizado”
Este glosario incluye la traducción literal o conceptual más adecuada al español, manteniendo los nombres propios de modelos y empresas en su forma original.
CAPITANiA utiliza estos conceptos para seleccionar y recomendar las herramientas más valiosas.
Agentes y Agentic Ai: Agentes y iA agentic → Sistemas de inteligencia artificial autónomos capaces de planificar, razonar, utilizar herramientas externas y ejecutar tareas complejas de manera independiente o colaborativa.
AutoGen: AutoGen → Framework open-source de Microsoft para crear sistemas multi-agente que colaboran entre sí.
AWS Bedrock Agents: Agentes de AWS Bedrock → Plataforma de Amazon Web Services para construir y desplegar agentes de iA autónomos.
Coding: Programación → Capacidad de un modelo de IA para generar, entender, depurar o analizar código de programación en diversos lenguajes.
CrewAI: CrewAI → Framework open-source para orquestar equipos (crews) de agentes de iA que trabajan en colaboración para resolver tareas complejas.
DeepSeek-R1 / V3: DeepSeek-R1 / V3 → Modelos de iA desarrollados por la empresa china DeepSeek, destacados por su alta eficiencia en programación, matemáticas y razonamiento a bajo costo.
Edge computing: Computación en el borde → Procesamiento de datos realizado directamente en dispositivos locales (móviles, IoT, etc.) en lugar de en la nube, ideal para modelos compactos y baja latencia.
Falcon series: Serie Falcon → Familia de modelos open-source desarrollados por TII (Emiratos Árabes Unidos), optimizados para razonamiento eficiente en entornos con recursos limitados.
Frameworks open-source: Frameworks de código abierto → Herramientas o bibliotecas de software cuyo código fuente es público, permitiendo que cualquiera las use, modifique o distribuya libremente.
Frontier: Frontera / De vanguardia → Término que designa los modelos de iA más avanzados y potentes del momento, que marcan el límite actual de la tecnología.
Gemini 3 Pro: Gemini 3 Pro → Modelo multimodal de frontera desarrollado por Google DeepMind, líder en integración de texto, imagen, audio y vídeo.
GLM-4.6V: GLM-4.6V → Modelo multimodal open-source de Zhipu Ai (China), fuerte en procesamiento de visión y razonamiento.
Grok 4.1: Grok 4.1 → Modelo de xAI (EE.UU.), integrado en tiempo real con datos de la plataforma X, destacado en matemáticas, razonamiento y bajo nivel de alucinaciones.
Hype: Bombo publicitario / Exageración mediática → Inflación de expectativas alrededor de una tecnología, a menudo sin sustento en resultados reales sostenibles.
LangChain / LangGraph: LangChain / LangGraph → Frameworks open-source populares para construir aplicaciones con grandes modelos de lenguaje, incluyendo cadenas de razonamiento y agentes.
LlamaIndex: LlamaIndex → Framework open-source para indexar y recuperar datos en aplicaciones de IA (anteriormente conocido como GPT Index).
Mistral Large 3: Mistral Large 3 → Modelo eficiente y multilingüe de Mistral AI (Francia/Europa), basado en arquitectura MoE (Mixture of Experts – Mezcla de Expertos).
Modelos abiertos (open-source / open-weight): Modelos abiertos / de código abierto o pesos abiertos → Modelos cuyo código, arquitectura y parámetros (pesos) son públicos, permitiendo su descarga, modificación y ejecución local.
Modelos cerrados (closed-source): Modelos cerrados / de código propietario → Modelos cuyo acceso está restringido a APIs controladas por la empresa desarrolladora; su código interno no es público.
Multimodales: Multimodales → Modelos de iA capaces de procesar e integrar de forma nativa diferentes tipos de datos (texto, imagen, audio, vídeo).
Narrow o Especializados: Estrechos o Especializados → Modelos optimizados para tareas específicas (como programación, matemáticas o dominios sectoriales), ofreciendo mayor precisión en áreas delimitadas.
Oriente (China): Oriente (China) → Región dominada por empresas chinas como DeepSeek, Alibaba y Zhipu Ai, enfocadas en modelos eficientes, de pesos abiertos y aplicaciones a gran escala.
Qwen 3: Qwen 3 → Familia de modelos de Alibaba (China), destacada en multimodalidad, pesos abiertos y razonamiento avanzado.
Reasoning: Razonamiento → Capacidad de un modelo de iA para pensar lógicamente, resolver problemas paso a paso y llegar a conclusiones coherentes.
Sur Global / Eurasia: Sur Global / Eurasia → Países emergentes (como Emiratos Árabes con TII) que desarrollan o adoptan modelos accesibles adaptados a entornos con recursos limitados.
Vertex AI Agent Builder: Constructor de Agentes de Vertex Ai → Plataforma de Google Cloud para crear y gestionar agentes de iA autónomos