OpenClaw ahora es compatible con Ollama: configuración con un solo comando

Estaba a medio camino de configurar otra clave API en la nube — la cuarta de este mes — cuando apareció una notificación en el Discord de OpenClaw. Ollama era ahora un proveedor oficial. No un hack de la comunidad. No un parche que involucraba tres archivos de configuración y una plegaria. Una integración oficial de primera clase respaldada por un único comando de configuración.

Dejé lo que estaba haciendo y lo ejecuté inmediatamente.

openclaw onboard --auth-choice ollama

Eso fue todo. Mis modelos locales de Ollama — los que había estado usando para generación de código, asistencia en escritura y análisis de datos — estaban de repente disponibles a través de todas las apps de mensajería que uso. WhatsApp. Telegram. Discord. Sin claves API. Sin facturas de la nube. Sin picos de latencia a las 2 PM cuando la mitad del planeta decide atacar el mismo endpoint de inferencia.

Lo que sucedió durante la semana siguiente cambió fundamentalmente mi forma de pensar sobre los asistentes personales de IA. Y honestamente, me hizo preguntarme por qué había estado pagando por inferencia en la nube todo este tiempo.

Por qué este anuncio importa más de lo que crees

Aquí hay algo de contexto que hace que esta integración con Ollama sea significativa más allá de la obvia reacción de "genial, otro proveedor".

OpenClaw — el asistente personal de IA de código abierto creado por Peter Steinberger (@steipete) — ha explotado en popularidad desde finales de enero de 2026. El proyecto alcanzó 247,000 estrellas en GitHub a principios de marzo. No es solo un chatbot en tu terminal. OpenClaw es un sistema agéntico completo que se ejecuta localmente en tu máquina y se conecta a tus apps de mensajería. Lee correos electrónicos, gestiona calendarios, hace check-in en vuelos, navega la web, escribe y ejecuta código — todo activado desde un simple mensaje de chat.

El problema, hasta ahora, era la columna vertebral de IA. Necesitabas un proveedor de LLM en la nube. Claude, GPT, DeepSeek — todas opciones sólidas, pero todas requiriendo claves API, seguimiento de uso y facturas mensuales que escalan según cuánto uses realmente tu asistente. Para desarrolladores como yo que usan agentes de IA docenas de veces al día, esos costos se acumulan rápidamente.

Ollama cambia esa ecuación por completo. Ejecuta tus modelos localmente, no pagues nada por la inferencia y mantén cada conversación en tu propio hardware. Las implicaciones de privacidad por sí solas merecen atención — pero el ahorro en costos y la ejecución local sin latencia — eso es lo que me emocionó lo suficiente como para probar esto la misma hora que se lanzó.

Pero antes de guiarte a través de la configuración y lo que aprendí ejecutando esto durante una semana, hay una parte de esta historia que la mayoría se está perdiendo — y tiene que ver con qué modelos realmente funcionan bien como cerebro de OpenClaw.

La historia de origen que deberías conocer

Si has estado siguiendo la saga de OpenClaw, sabes que el nombre ha tenido todo un recorrido. Peter Steinberger lo lanzó originalmente como Clawdbot en noviembre de 2025. El proyecto se hizo viral a finales de enero de 2026 — en parte porque el concepto de ejecutar un agente personal de IA desde WhatsApp era genuinamente novedoso, y en parte porque @steipete tiene un talento para construir cosas que los desarrolladores quieren usar inmediatamente.

Luego vino la situación de marca registrada con Anthropic, un rápido cambio de nombre a Moltbot (que, siendo justos, nunca fue muy fácil de pronunciar), y finalmente el aterrizaje en OpenClaw. La marca del langostino se mantuvo a través de todo eso. Si has visto el icónico emoji de langosta por todas partes en los círculos de desarrolladores de IA últimamente, ahora sabes de dónde viene.

El nombre "OpenClaw" y la metáfora de la muda en realidad captura lo que hace especial a este proyecto. Los langostinos mudan su caparazón para crecer. OpenClaw sigue desprendiéndose de limitaciones — primero el modelo de código cerrado, luego la dependencia de un solo proveedor, y ahora el requisito de APIs en la nube por completo.

Quiero dar un reconocimiento específico a @steipete aquí. No solo por construir OpenClaw en primer lugar, sino por la forma en que el proyecto ha sido guiado a través de su fase de crecimiento explosivo. La integración con Ollama no ocurrió de forma aislada — fue revisada, probada y refinada con aportes reales de la comunidad. Y honestamente, tener a alguien con la formación en ingeniería de Steinberger (construyó PSPDFKit, uno de los SDKs de PDF más respetados en desarrollo móvil) liderando las decisiones de arquitectura me da confianza de que esto no es solo un trabajo improvisado pegado a un lado. La integración es sólida porque el proceso de revisión fue riguroso.

Un agradecimiento especial a @steipete por ayudar con y revisar la integración del proveedor Ollama. La comunidad de IA de código abierto es mejor cuando ingenieros experimentados invierten su tiempo en hacer bien los cimientos.

Entonces, ¿cómo es la configuración real? Es casi anticlimáticamente simple.

Cómo configurar OpenClaw con Ollama en menos de cinco minutos

Voy a explicarte exactamente lo que hice, incluyendo los pequeños obstáculos que encontré, para que puedas evitarlos.

Paso 1: Asegúrate de que Ollama esté ejecutándose

Esto suena obvio, pero he visto a personas tropezar con esto. Necesitas Ollama instalado y ejecutándose con al menos un modelo descargado.

# Check Ollama is running
ollama list

# If you don't have a model yet, grab one
# OpenClaw recommends models with 64K+ context windows
ollama pull qwen3-coder

El requisito de la ventana de contexto es lo que la mayoría de las guías omiten. OpenClaw necesita al menos 64,000 tokens de contexto para manejar de forma confiable tareas agénticas de múltiples pasos — del tipo donde está leyendo un hilo de correo, redactando una respuesta, verificando tu calendario en busca de conflictos y luego enviando la respuesta. Los modelos con contexto corto funcionarán para consultas simples pero fallarán en cualquier cosa que requiera razonamiento sostenido a través de múltiples llamadas a herramientas.

Mis modelos recomendados para OpenClaw a marzo de 2026:

Modelo	Contexto	Ideal para
qwen3-coder	128K	Generación de código, tareas técnicas
glm-4.7	128K	Trabajo de asistente de propósito general
glm-4.7-flash	64K	Respuestas más rápidas, tareas ligeras
gpt-oss:20b	128K	Buen equilibrio entre velocidad y capacidad
kimi-k2.5	128K	Razonamiento fuerte, tareas de múltiples pasos

He estado usando qwen3-coder para la mayoría de las tareas y cambiando a glm-4.7-flash cuando solo necesito respuestas rápidas. La belleza de los modelos locales es que cambiar no cuesta nada — no se necesita una clave API diferente, ni un nivel de facturación diferente. Solo cambia el nombre del modelo.

Paso 2: Ejecuta el comando de configuración

Aquí es donde ocurre la magia:

openclaw onboard --auth-choice ollama

El asistente hace varias cosas automáticamente:

Detecta tu instalación de Ollama — verifica la dirección predeterminada (generalmente http://localhost:11434) y confirma la conexión
Lista tus modelos disponibles — cada modelo que hayas descargado aparece para selección
Configura tu modelo predeterminado — si solo tienes un modelo, lo selecciona automáticamente. De lo contrario, tú eliges.
Configura el proveedor — escribe la configuración necesaria para que OpenClaw sepa enrutar todas las solicitudes de inferencia a tu instancia local de Ollama
Instala el daemon gateway — el proceso en segundo plano que conecta tus apps de mensajería con el agente OpenClaw

Todo el proceso me tomó unos 90 segundos. Sin archivos JSON que editar a mano. Sin variables de entorno que exportar. Sin contenedores Docker que orquestar. Solo responde las preguntas y listo.

🦞 OpenClaw Onboard — Provider Setup
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Detected Ollama at localhost:11434 ✓
Available models:
  → qwen3-coder (128K context) ✓ recommended
  → glm-4.7-flash (64K context) ✓ compatible
  → llama3.3 (8K context) ⚠ low context

Selected: qwen3-coder
Gateway daemon installed ✓
Provider configured ✓

Your lobster is ready. 🦞

Esa última línea me sacó una sonrisa. La personalidad del equipo de OpenClaw se refleja incluso en la salida de la CLI.

Paso 3: Conecta tus apps de mensajería

Esta es la parte donde OpenClaw se vuelve genuinamente diferente de ejecutar Ollama solo. Ollama por sí mismo es un servidor de inferencia local — poderoso, pero interactúas con él a través de un terminal o una llamada API. OpenClaw lo convierte en un asistente que vive en las apps que ya tienes abiertas todo el día.

# Connect WhatsApp (uses QR code pairing)
openclaw connect whatsapp

# Connect Telegram
openclaw connect telegram --token YOUR_BOT_TOKEN

# Connect Discord
openclaw connect discord --token YOUR_BOT_TOKEN

Conecté WhatsApp primero porque es donde paso la mayor parte de mi tiempo de mensajería. El emparejamiento por código QR tomó unos 10 segundos. Después de eso, podía enviar un mensaje a mi bot de OpenClaw desde WhatsApp y obtener respuestas impulsadas completamente por mi modelo local qwen3-coder.

Sin datos saliendo de mi máquina. Sin costos de API. La respuesta venía de la GPU que está a un metro de mí.

Paso 4: Pruébalo con una tarea real

No te limites a decir "hola" y darlo por hecho. Dale algo que ejercite las capacidades agénticas:

Me: Check my calendar for tomorrow and draft a summary
    of what I have scheduled. If there are any conflicts,
    flag them.

OpenClaw 🦞: Looking at your calendar for March 17...

You have 4 events tomorrow:
- 9:00 AM - Standup (30 min)
- 10:30 AM - Client call with Ramlit team (1 hr)
- 11:00 AM - Code review session (1 hr) ⚠️ CONFLICT
- 2:00 PM - Deploy planning (45 min)

⚠️ Conflict detected: "Client call" (10:30-11:30)
overlaps with "Code review" (11:00-12:00) by 30 minutes.

Suggestion: Move code review to 1:00 PM? That gives you
a 1-hour buffer before deploy planning. Want me to
reschedule it?

Toda esa interacción — acceso al calendario, detección de conflictos, generación de sugerencias — se ejecutó en mi modelo local de Ollama. La respuesta llegó en unos 4 segundos. Con una API en la nube, tendría latencia de red además del tiempo de inferencia, más pagar por el privilegio.

Esto es lo que más me sorprendió: la diferencia de calidad entre ejecutar qwen3-coder localmente a través de OpenClaw versus usar un modelo en la nube fue menor de lo que esperaba. Para tareas rutinarias de asistente — redacción de correos, gestión de calendario, preguntas rápidas de código, organización de archivos — el modelo local las manejó perfectamente. Solo noté la diferencia al hacer cadenas de razonamiento complejas de múltiples pasos que requerían mantener grandes cantidades de contexto simultáneamente.

Si prefieres que alguien construya este tipo de configuración de asistente personal de IA desde cero adaptada a tu flujo de trabajo, acepto encargos personalizados de automatización con IA. Puedes ver lo que he construido en fiverr.com/s/EgxYmWD.

¿Qué pasa cuando todos tus modelos de Ollama funcionan con OpenClaw?

Esta es la parte que no aprecié completamente hasta que llevaba unos días con la configuración. Cuando Ollama es tu proveedor de OpenClaw, no solo obtienes acceso a un modelo. Obtienes acceso a cada modelo que hayas descargado. Y puedes cambiar entre ellos sobre la marcha.

Me: /model glm-4.7-flash
OpenClaw 🦞: Switched to glm-4.7-flash ✓

Me: Quick — what's the CORS header syntax for allowing
    specific origins?

OpenClaw 🦞: Access-Control-Allow-Origin: https://yourdomain.com

For multiple origins, you'll need server-side logic —
the header only accepts one origin or *. In Express:

app.use(cors({
  origin: ['https://a.com', 'https://b.com']
}));

La respuesta de glm-4.7-flash llegó en menos de un segundo. Para búsquedas rápidas de datos y recordatorios de sintaxis, el modelo más pequeño es perfecto. No necesito un modelo de 120 mil millones de parámetros para recordarme un encabezado CORS.

Pero para tareas profundas — depurar una condición de carrera compleja, analizar una base de código o redactar un documento técnico detallado — cambio a qwen3-coder y dejo que se tome su tiempo. La capacidad de emparejar la capacidad del modelo con la complejidad de la tarea es algo que simplemente no puedes hacer con tanta fluidez con proveedores en la nube. Con Ollama, el costo de cambiar es literalmente cero.

El patrón de enrutamiento de modelos que adopté

Después de una semana de experimentación, así es como he estado usando los diferentes modelos:

Preguntas rápidas y búsquedas — glm-4.7-flash. Rápido, económico (gratis), preciso para contenido factual. Lo uso para probablemente el 60% de mis interacciones diarias.

Generación y revisión de código — qwen3-coder. Mejor manteniendo el contexto a lo largo de archivos de código largos, entiende patrones específicos de frameworks y genera código más listo para producción.

Escritura extensa y análisis — glm-4.7 o kimi-k2.5. Cuando necesito que el modelo mantenga mucho contexto y produzca resultados matizados, estas son mis opciones principales.

Solicitudes experimentales y extrañas — cualquier modelo nuevo que haya descargado esa semana. Uno de los placeres de Ollama es probar nuevos modelos conforme van saliendo. La semana pasada probé gpt-oss:20b por primera vez y me impresionó su razonamiento en tareas con mucha matemática.

El punto es: a OpenClaw no le importa qué modelo estés ejecutando. La integración trata a Ollama como un proveedor unificado. Tus apps de mensajería no saben ni les importa si la respuesta vino de un modelo de 7 mil millones o de 120 mil millones de parámetros. Esa capa de abstracción es limpia, y es una de las razones por las que esta integración se siente como una funcionalidad de primera clase en lugar de un añadido improvisado.

Ejecutar OpenClaw localmente: lo que nadie te advierte

Les haría un mal servicio si hiciera que esto suene como pura magia sin compromisos. Encontré limitaciones reales durante mi semana de pruebas, y deberían conocerlas antes de apostar todo a la inferencia local.

La memoria de la GPU es tu cuello de botella

Los modelos más grandes — gpt-oss:120b, kimi-k2.5, cualquier cosa por encima de 30 mil millones de parámetros — necesitan VRAM seria. Estoy ejecutando una máquina con una GPU capaz, y aun así tuve que ser cuidadoso con qué modelo mantenía cargado. Ollama puede descargar a CPU, pero la diferencia de velocidad es brutal. Una consulta que tarda 3 segundos en GPU tarda 40 segundos en CPU para un modelo grande.

Mi consejo: Comienza con un modelo que quepa cómodamente en la memoria de tu GPU. qwen3-coder en su cuantización predeterminada funciona perfectamente con 16GB de VRAM. No busques el modelo más grande porque suena impresionante — busca el que responda lo suficientemente rápido como para no romper tu flujo de trabajo.

La ventana de contexto no es solo un número

La documentación de OpenClaw dice 64K de contexto mínimo, y lo dicen en serio. Intenté ejecutar un modelo con 32K de contexto y tuve problemas en la tercera tarea de múltiples pasos. El agente perdió el hilo del historial de la conversación a mitad de tarea y comenzó a repetir acciones que ya había completado. Cambiar a un modelo de 64K+ lo solucionó al instante.

Esto tiene sentido cuando piensas en lo que OpenClaw está haciendo. No solo está teniendo una conversación — está manteniendo el historial de llamadas a herramientas, resultados de funciones, prompts del sistema y todo tu hilo de mensajes. Esa sobrecarga consume contexto rápidamente. Un modelo con 8K de contexto podría responder una sola pregunta bien, pero se desmorona en el momento en que OpenClaw necesita encadenar tres o cuatro acciones juntas.

La primera respuesta es lenta (luego es rápida)

Ollama carga los modelos en memoria en el primer uso. Si el modelo no está cargado cuando envías tu primer mensaje del día, espera un retraso de 10-30 segundos mientras se carga. Después de eso, las respuestas son rápidas — a menudo más rápidas que las APIs en la nube porque has eliminado los viajes de ida y vuelta de la red por completo.

Resolví el problema del arranque en frío añadiendo un simple cron job que envía una solicitud ficticia a Ollama cada mañana a las 8 AM:

# Add to crontab: keep model warm
0 8 * * * curl -s http://localhost:11434/api/generate \
  -d '{"model":"qwen3-coder","prompt":"ping","stream":false}' \
  > /dev/null 2>&1

Un pequeño truco, una gran mejora en la calidad de vida.

No todas las tareas pertenecen a un modelo local

Seré honesto sobre esto: para flujos de trabajo agénticos complejos de múltiples pasos que requieren un razonamiento fuerte sobre contextos muy largos — piensa en "analiza toda esta base de código y genera un plan de migración" — los modelos en la nube como Claude todavía llevan ventaja. La brecha se cierra cada mes conforme los modelos de código abierto mejoran, pero existe hoy.

Mi enfoque es pragmático. Uso modelos locales de Ollama a través de OpenClaw para el 80% de mis tareas diarias — las cosas rutinarias que ocurren docenas de veces al día. Para el 20% restante que demanda razonamiento de nivel frontera, mantengo un proveedor en la nube configurado como respaldo. OpenClaw admite múltiples proveedores simultáneamente, así que cambiar es fluido.

El ahorro al mover el 80% de las consultas a inferencia local ha sido significativo. Mi factura mensual de API en la nube bajó de alrededor de $45/mes a menos de $10.

Más allá del chat: las tareas que me sorprendieron

Esperaba que OpenClaw + Ollama manejara bien el chat. Lo que no esperaba era lo capaz que sería en tareas que nunca me había molestado en intentar con un modelo local antes.

Clasificación de correo desde WhatsApp

Cada mañana, envío un mensaje a mi bot de OpenClaw:

Me: Morning brief — check email, flag anything urgent,
    summarize the rest

Dos minutos después (el escaneo de correos toma un momento), recibo un resumen priorizado. Elementos urgentes al principio con acciones recomendadas. No urgentes agrupados por categoría. Spam de newsletters identificado y listo para archivar. Todo procesado por qwen3-coder sentado en mi escritorio.

El hecho de que esto suceda desde WhatsApp — la misma app que ya estoy revisando — significa que realmente lo uso todos los días. Cuando requería abrir un terminal separado y ejecutar un script de Python, me lo saltaba la mitad de las veces.

Solicitudes de revisión de código vía Telegram

Conecté OpenClaw al grupo de Telegram que uso para colaboración en proyectos personales. Ahora puedo pegar un fragmento de código o un enlace de PR y obtener retroalimentación instantánea:

Me: Review this function — anything wrong?

[pastes function]

OpenClaw 🦞: Two issues:

1. Line 12: You're not awaiting the async call inside
   the loop. This will fire all requests simultaneously
   instead of sequentially. If the API has rate limits,
   you'll hit them.

2. Line 23: The error catch swallows the exception
   silently. At minimum, log it. Better: propagate it
   with context about which iteration failed.

Want me to rewrite it with both fixes?

Esa revisión vino de un modelo local. Ningún código salió de mi máquina. Para alguien que trabaja en proyectos de clientes con NDAs, el aspecto de privacidad no es un lujo — es un requisito.

Gestión y organización de archivos

Esta me tomó por sorpresa. Le pedí a OpenClaw que me ayudara a organizar una carpeta de descargas desordenada:

Me: Organize my ~/Downloads folder — group files by type,
    move anything older than 30 days to archive, and list
    what you did

OpenClaw 🦞: Done. Here's what I moved:

📁 Documents (14 files) → ~/Downloads/docs/
📁 Images (43 files) → ~/Downloads/images/
📁 Code (8 files) → ~/Downloads/code/
📁 Archives (6 files) → ~/Downloads/archives/
📁 Misc (3 files) → ~/Downloads/other/

Archived (>30 days): 23 files → ~/Archive/2026-02/

Total: 97 files organized. 23 archived.

Ejecutar esto a través de una API en la nube significaría subir mi listado de archivos al servidor de alguien más. Con Ollama local, el directorio nunca sale de mi máquina.

¿Cómo se compara OpenClaw + Ollama con las configuraciones solo en la nube?

Ejecuté ambas configuraciones en paralelo durante cinco días. Esto es lo que encontré — sin benchmarks fabricados, solo mi experiencia honesta en el uso real diario.

Velocidad de respuesta para tareas simples: Ollama local fue consistentemente más rápido. Sin latencia de red significa respuestas en menos de un segundo para consultas rápidas. Los proveedores en la nube típicamente añadían 1-3 segundos de sobrecarga incluso para respuestas simples.

Calidad de respuesta para razonamiento complejo: Los modelos en la nube (particularmente Claude) aún manejaron el razonamiento de múltiples pasos de forma más confiable. Cuando le pedí a OpenClaw que planificara un flujo de trabajo de despliegue complejo con ocho pasos secuenciales y ramificación condicional, el modelo en la nube lo clavó. El modelo local acertó en aproximadamente el 80% y necesitó una corrección.

Costo en cinco días: La configuración solo en la nube me costó aproximadamente $8 en llamadas API. La configuración con Ollama costó $0. Mi factura de electricidad no cambió notablemente — la GPU ya estaba funcionando para otras tareas.

Privacidad: Sin competencia. Lo local gana absolutamente. Cada consulta, cada referencia de archivo, cada fragmento de correo permaneció en mi hardware.

Confiabilidad: La nube depende de la conectividad a internet y del tiempo de actividad del proveedor. Durante una breve interrupción de internet en el día tres, mi configuración local de OpenClaw siguió funcionando sin perder el ritmo. La configuración en la nube estaba completamente muerta.

El enfoque híbrido — Ollama para tareas diarias, nube para razonamiento complejo — me dio lo mejor de ambos mundos. Y OpenClaw hace que cambiar entre ellos sea trivialmente fácil.

Configurando el enfoque híbrido: local + respaldo en la nube

Si el modelo híbrido te parece atractivo, así es como lo configuré:

# Primary: Ollama (local, free, private)
openclaw onboard --auth-choice ollama

# Secondary: Cloud provider as fallback
openclaw provider add --name claude --type anthropic \
  --api-key $ANTHROPIC_API_KEY

# Set routing rules
openclaw config set routing.default ollama
openclaw config set routing.complex claude

Con esta configuración, OpenClaw enruta la mayoría de las solicitudes a Ollama por defecto. Cuando pido explícitamente el modelo en la nube (usando /model claude en el chat) o cuando una tarea supera un umbral de complejidad, lo enruta al proveedor en la nube.

La configuración me da una factura mensual de IA por debajo de $10 mientras sigo teniendo acceso a modelos de frontera cuando realmente los necesito. Antes de esto, gastaba $40-50/mes. A lo largo de un año, eso es casi $500 ahorrados — y mi experiencia diaria con el asistente es en realidad mejor porque la inferencia local es más rápida para tareas rutinarias.

Lo que esto significa para el futuro de la IA personal

Quiero alejarme un momento porque esta integración con Ollama representa algo más grande que el anuncio de una sola funcionalidad.

Cuando OpenClaw se lanzó, la suposición era que los asistentes personales de IA necesitaban LLMs en la nube. El panorama de modelos locales a finales de 2025 simplemente no era lo suficientemente bueno para un trabajo agéntico confiable. Los modelos no podían mantener suficiente contexto. No eran lo suficientemente rápidos. Cometían demasiados errores en tareas de múltiples pasos.

Eso cambió rápidamente. A principios de 2026, modelos como qwen3-coder y glm-4.7 se volvieron lo suficientemente capaces para manejar cargas de trabajo reales de asistente. Ollama hizo que ejecutarlos localmente fuera extremadamente simple. Y ahora OpenClaw ha hecho que conectarlos a tu flujo de trabajo diario sea un solo comando.

La trayectoria es clara: la IA personal se dirige hacia lo local primero. La nube se convierte en la excepción para tareas de nivel frontera, no en el valor predeterminado para todo. Y el stack OpenClaw + Ollama es la forma más accesible de hacer ese cambio ahora mismo.

@steipete tomó una decisión temprana de mantener OpenClaw agnóstico respecto al modelo. Sin dependencia de un solo proveedor. Sin trato preferencial para la nube sobre lo local. Esa decisión arquitectónica está dando dividendos ahora. Cuando Ollama se volvió viable como un proveedor serio, la integración fue limpia porque la capa de abstracción ya estaba ahí. Las buenas decisiones de ingeniería se componen con el tiempo — y este es un ejemplo de libro.

El reto de una hora: prueba esto hoy

No quiero que este sea otro artículo que leas, asientas con la cabeza y luego olvides. Así que aquí tienes un reto concreto.

Pon un temporizador de una hora. En esa hora:

Instala Ollama si aún no lo has hecho (5 minutos)
Descarga qwen3-coder — ollama pull qwen3-coder (depende de tu velocidad de internet, pero la descarga se ejecuta en segundo plano)
Instala OpenClaw desde el repositorio de GitHub (10 minutos incluyendo la compilación)
Ejecuta el comando de configuración — openclaw onboard --auth-choice ollama (2 minutos)
Conecta una app de mensajería — la que más uses (5 minutos)
Dale tres tareas reales — no "hola," no ejemplos de juguete. Pídele que haga algo para lo que normalmente abrirías un navegador o terminal.

Si tu experiencia es algo parecida a la mía, quedarás enganchado para la segunda tarea. Hay algo genuinamente encantador en enviar un mensaje de WhatsApp y recibir una respuesta útil impulsada completamente por hardware que tú posees.

El langostino ha llegado a tu máquina local. Y está listo para trabajar.

Preguntas frecuentes

¿OpenClaw funciona con todos los modelos de Ollama?

Sí — cada modelo disponible en tu instalación local de Ollama funciona con OpenClaw después de ejecutar openclaw onboard --auth-choice ollama. El asistente de configuración detecta todos los modelos descargados automáticamente. Para tareas agénticas confiables de múltiples pasos, elige modelos con ventanas de contexto de al menos 64K. Para la lista completa de modelos recomendados, consulta la sección de configuración arriba.

¿Cuánta VRAM necesito para ejecutar OpenClaw con Ollama?

Planifica un mínimo de 8-16GB de VRAM. Modelos como qwen3-coder funcionan cómodamente con 16GB de VRAM en la cuantización predeterminada. Modelos más pequeños como glm-4.7-flash funcionan con 8GB. Puedes descargar a CPU, pero los tiempos de respuesta aumentan significativamente — de 3 segundos a más de 30 segundos para modelos más grandes.

¿Puedo usar OpenClaw con Ollama y un proveedor en la nube?

Absolutamente. OpenClaw admite múltiples proveedores simultáneamente. Configura Ollama como tu predeterminado para tareas diarias y añade un proveedor en la nube (Claude, GPT, DeepSeek) como respaldo para razonamiento complejo. Consulta el tutorial de configuración híbrida arriba para los comandos exactos.

¿Mis datos son privados al usar OpenClaw con Ollama?

Completamente. Con Ollama como tu proveedor, toda la inferencia se ejecuta en tu máquina local. Ninguna consulta, contenido de archivos o datos de conversación salen de tu hardware. Esto hace que la configuración sea ideal para desarrolladores que trabajan bajo NDAs o manejan datos sensibles de clientes.

¿Qué apps de mensajería soporta OpenClaw?

OpenClaw se conecta a WhatsApp, Telegram, Discord, Signal, Slack e iMessage. Cada app tiene su propio comando de conexión — openclaw connect [app] — y la configuración típicamente toma menos de cinco minutos por plataforma.

Let's Work Together

Looking to build AI systems, automate workflows, or scale your tech infrastructure? I'd love to help.

Fiverr (custom builds & integrations): fiverr.com/s/EgxYmWD
Portfolio: mejba.me
Ramlit Limited (enterprise solutions): ramlit.com
ColorPark (design & branding): colorpark.io
xCyberSecurity (security services): xcybersecurity.io