{"id":1943,"date":"2025-07-16T19:49:31","date_gmt":"2025-07-16T22:49:31","guid":{"rendered":"https:\/\/www.erudio.com.br\/blog\/?p=1943"},"modified":"2026-05-11T19:54:39","modified_gmt":"2026-05-11T22:54:39","slug":"como-o-ollama-orquestra-llms-localmente-a-arquitetura-que-permite-rodar-inteligencia-artificial-sem-depender-da-nuvem","status":"publish","type":"post","link":"https:\/\/www.erudio.com.br\/blog\/como-o-ollama-orquestra-llms-localmente-a-arquitetura-que-permite-rodar-inteligencia-artificial-sem-depender-da-nuvem\/","title":{"rendered":"Como o Ollama orquestra LLMs localmente: a arquitetura que permite rodar Intelig\u00eancia Artificial sem depender da nuvem"},"content":{"rendered":"\n\n<p style=\"margin-top: 20px;\">Se voc\u00ea j\u00e1 leu outros posts aqui no blog sobre Ollama, sabe que a ferramenta resolve um problema concreto: permitir que qualquer pessoa ou organiza\u00e7\u00e3o rode LLMs diretamente na pr\u00f3pria infraestrutura, sem enviar dados para servidores externos. Mas como exatamente isso funciona por dentro? O que acontece desde o momento em que voc\u00ea digita um comando no terminal at\u00e9 o modelo responder?<\/p>\n\n<p>\u00c9 isso que a gente vai destrinchar nesse post. Entender a arquitetura do Ollama n\u00e3o \u00e9 s\u00f3 curiosidade t\u00e9cnica \u2014 \u00e9 o que separa quem usa a ferramenta de quem consegue configur\u00e1-la, mant\u00ea-la e escalar ela dentro de uma organiza\u00e7\u00e3o.<\/p>\n\n<h2>Vis\u00e3o geral: as tr\u00eas grandes partes<\/h2>\n\n<p>A arquitetura do Ollama pode ser dividida em tr\u00eas blocos principais que se comunicam entre si.<\/p>\n\n<p>O <strong>Ollama Model Library<\/strong> \u00e9 o reposit\u00f3rio remoto onde ficam armazenados todos os modelos dispon\u00edveis para download \u2014 Llama, Qwen, DeepSeek, Gemma, Mistral e muitos outros. \u00c9 o ponto de partida: voc\u00ea acessa via browser, escolhe o modelo e o n\u00famero de par\u00e2metros, copia o comando e executa na sua m\u00e1quina.<\/p>\n\n<p>O <strong>Ollama Host<\/strong> \u00e9 onde o Ollama de fato roda. Pode ser a sua m\u00e1quina local, um servidor interno da empresa, ou at\u00e9 uma inst\u00e2ncia na AWS ou Azure. Dentro dele vive o <strong>Ollama Engine<\/strong>, que \u00e9 o c\u00e9rebro da opera\u00e7\u00e3o \u2014 respons\u00e1vel por gerenciar os modelos baixados e os modelos em execu\u00e7\u00e3o.<\/p>\n\n<p>O <strong>Ollama Client<\/strong> \u00e9 a interface de comando que voc\u00ea usa para interagir com o Ollama Engine. \u00c9 ele que recebe os seus comandos e os repassa ao engine.<\/p>\n\n<p>O diagrama abaixo ilustra como esses tr\u00eas blocos se conectam:<\/p>\n\n<br>\n<img decoding=\"async\" src=\"https:\/\/www.erudio.com.br\/blog\/wp-content\/uploads\/2026\/05\/architechture_of_ollama.png\" alt=\"Diagrama da arquitetura do Ollama mostrando Ollama Client, Ollama Host com Engine, Model Runtimes e Pulled Models, e Ollama Model Library\" style=\"max-width: 100%; display: block; margin: 16px auto;\">\n<br>\n\n<h2>O Ollama Engine por dentro: Pulled Models e Model Runtimes<\/h2>\n\n<p>Dentro do Ollama Host, o Engine gerencia dois estados distintos em que um modelo pode se encontrar.<\/p>\n\n<p><strong>Pulled Models<\/strong> s\u00e3o os modelos que j\u00e1 foram baixados para a sua m\u00e1quina mas que n\u00e3o est\u00e3o em execu\u00e7\u00e3o no momento. Quando voc\u00ea executa um <code>ollama pull mistral<\/code>, por exemplo, o Ollama vai at\u00e9 a Model Library, baixa o modelo e o armazena localmente. Ele fica dispon\u00edvel para uso sem precisar baixar novamente.<\/p>\n\n<p><strong>Model Runtimes<\/strong> s\u00e3o os modelos que est\u00e3o de fato em execu\u00e7\u00e3o \u2014 carregados na mem\u00f3ria e prontos para responder. Quando voc\u00ea executa um <code>ollama run mistral<\/code>, o Engine verifica se o modelo j\u00e1 est\u00e1 nos Pulled Models. Se estiver, inicializa o runtime a partir dele. Se n\u00e3o estiver, vai at\u00e9 a Model Library, baixa, salva nos Pulled Models e s\u00f3 ent\u00e3o inicializa o runtime. Voc\u00ea pode ter m\u00faltiplos runtimes ativos simultaneamente \u2014 um do Mistral, um do Dolphin, um do Llama \u2014 e o Engine gerencia todos eles.<\/p>\n\n<p>Esse design \u00e9 importante do ponto de vista corporativo: ele permite que a equipe de TI fa\u00e7a o pull de todos os modelos necess\u00e1rios de uma s\u00f3 vez, e a partir da\u00ed a infraestrutura opera sem precisar de conex\u00e3o com a internet, j\u00e1 que tudo est\u00e1 armazenado localmente.<\/p>\n\n<h2>As duas formas de interagir com o Ollama<\/h2>\n\n<p>Existem duas maneiras de se comunicar com o Ollama Engine, e elas atendem perfis de usu\u00e1rio bem diferentes.<\/p>\n\n<p>A primeira \u00e9 o <strong>Ollama Client<\/strong>, que opera via terminal com comandos diretos como <code>ollama run<\/code>, <code>ollama pull<\/code> e <code>ollama create<\/code>. \u00c9 a forma mais direta e a mais usada por desenvolvedores e times de infraestrutura. Tamb\u00e9m \u00e9 o caminho para automa\u00e7\u00f5es e integra\u00e7\u00f5es com outros sistemas.<\/p>\n\n<p>A segunda s\u00e3o as <strong>ferramentas de UI<\/strong>, que se conectam ao Ollama Engine e oferecem uma interface gr\u00e1fica para os usu\u00e1rios finais. A mais popular atualmente \u00e9 o <strong>Open WebUI<\/strong>, que entrega uma experi\u00eancia muito pr\u00f3xima ao ChatGPT \u2014 com hist\u00f3rico de conversas, troca de modelos, configura\u00e7\u00f5es de comportamento \u2014 sem que o usu\u00e1rio precise saber nada sobre linha de comando. Existem tamb\u00e9m o <strong>LM Studio<\/strong> e o <strong>Tabby<\/strong>, cada um com caracter\u00edsticas pr\u00f3prias, mas o Open WebUI \u00e9 o que tem o ecossistema mais maduro e a ado\u00e7\u00e3o mais ampla.<\/p>\n\n<p>Para o contexto corporativo, essa separa\u00e7\u00e3o \u00e9 especialmente \u00fatil: o time t\u00e9cnico gerencia tudo pelo Client, enquanto os usu\u00e1rios de neg\u00f3cio interagem pelo Open WebUI sem nenhum atrito.<\/p>\n\n<h2>O Ollama Host n\u00e3o precisa estar na sua m\u00e1quina<\/h2>\n\n<p>Um detalhe da arquitetura que passa despercebido mas que tem grande relev\u00e2ncia para implanta\u00e7\u00f5es corporativas: o Ollama Host e o Ollama Client s\u00e3o componentes separados e podem rodar em m\u00e1quinas diferentes.<\/p>\n\n<p>Isso significa que voc\u00ea pode ter um servidor dedicado rodando o Ollama Engine \u2014 com hardware robusto, GPU de alto desempenho, armazenamento adequado para m\u00faltiplos modelos \u2014 e qualquer m\u00e1quina da rede pode usar o Client ou uma ferramenta de UI para se conectar a ele. \u00c9 exatamente o modelo que faz sentido para uma empresa: uma infraestrutura centralizada, gerenciada pelo time de TI, acess\u00edvel por todos os usu\u00e1rios da rede interna, sem que nenhum dado saia do per\u00edmetro da organiza\u00e7\u00e3o.<\/p>\n\n<h2>Conclus\u00e3o<\/h2>\n\n<p>A arquitetura do Ollama \u00e9 mais simples do que parece \u00e0 primeira vista, mas foi projetada com flexibilidade suficiente para atender desde o desenvolvedor que quer experimentar um LLM no notebook at\u00e9 a empresa que precisa de uma solu\u00e7\u00e3o robusta de Intelig\u00eancia Artificial rodando na pr\u00f3pria infraestrutura. Entender como o Engine, os Pulled Models, os Model Runtimes e as interfaces se relacionam \u00e9 o primeiro passo para tirar o m\u00e1ximo da ferramenta \u2014 seja para uso pessoal ou para uma implanta\u00e7\u00e3o corporativa de verdade.<\/p>\n\n<p>Se quiser se aprofundar mais no tema, temos outros posts sobre Ollama aqui no blog.<\/p>\n\n<p><strong>Assista tamb\u00e9m:<\/strong> <a href=\"https:\/\/www.youtube.com\/watch?v=G7JIFH6y3bA\" target=\"_blank\" rel=\"noopener\">Arquitetura do Ollama Revelada: Entenda Como Funciona por Tr\u00e1s dos Bastidores<\/a><\/p>\n\n<iframe loading=\"lazy\" title=\"06   Arquitetura do Ollama Revelada Entenda Como Funciona por Tr\u00e1s dos Bastidores\" width=\"648\" height=\"365\" src=\"https:\/\/www.youtube.com\/embed\/G7JIFH6y3bA?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe>\n\n<h2>Treinamentos relacionados com essa postagem<\/h2>\n\n<a href=\"https:\/\/pub.erudio.com.br\/formacao-spring-ai-2026-inteligencia-artificial-com-java-spring-boot-chatgpt-deepseek-claude-e-mcp?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-top: 8px; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Spring AI 2026: Intelig\u00eancia Artificial com Java, Spring Boot, ChatGPT, DeepSeek, Claude e MCP\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/31-spring-ai-java.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/inteligencia-artificial-com-dotnet-ai-e-dotnet-10-apps-inteligentes-com-chatgpt-openai-deepseek-e-ollama?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Intelig\u00eancia Artificial com .NET AI e .NET 10: Aplica\u00e7\u00f5es Inteligentes com ChatGPT, OpenAI, DeepSeek e Ollama\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/33-dotnet-ai.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/formacao-spring-ai-2026-inteligencia-artificial-com-kotlin-spring-boot-chatgpt-deepseek-claude-e-mcp?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Spring AI 2026: Intelig\u00eancia Artificial com Kotlin, Spring Boot, ChatGPT, DeepSeek, Claude e MCP\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/32-code-ai-kspring.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/formacao-spring-boot-2026-do-zero-ao-continuous-deployment-na-aws-e-gcp-com-java-docker-e-kubernetes?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Spring Boot 2026: do Zero ao Deploy na AWS e GCP com Java, Docker e Kubernetes\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/07-rest-java.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/formacao-spring-boot-com-kotlin-rest-apis-profissionais-do-zero-ao-deploy-na-aws-com-docker-e-kubernetes?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Spring Boot com Kotlin: REST APIs Profissionais do Zero ao Deploy na AWS com Docker e Kubernetes\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/18-rest-spring-kotlin.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/carreira-em-ti-do-zero-ao-exterior-curriculo-entrevistas-negociacao-e-crescimento-profissional?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Carreira em TI do Zero ao Exterior: Curr\u00edculo, Entrevistas, Negocia\u00e7\u00e3o e Crescimento Profissional\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/13-career.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/formacao-microsservicos-2026-do-zero-ao-deploy-na-google-cloud-com-spring-boot-kubernetes-e-docker?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Microsservi\u00e7os 2026: do Zero ao Deploy na Google Cloud com Spring Boot, Kubernetes e Docker\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/14-microservices-java.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/formacao-java-testing-2026-testes-automatizados-com-junit-mockito-spring-boot-tdd-e-testcontainers?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Java Testing 2026: Testes Automatizados com JUnit, Mockito, Spring Boot, TDD e TestContainers\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/24-tests-java.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/docker-e-kubernetes-2026-do-zero-ao-deploy-profissional-na-aws-azure-e-gcp-com-github-actions?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Docker e Kubernetes 2026: do Zero ao Deploy Profissional na AWS, Azure e GCP com GitHub Actions\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/10-docker-to-aws.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/meus-cursos?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Docker e Kubernetes 2026: do Zero \u00e0 Intelig\u00eancia Artificial com MCP Catalog e Docker Model Runner\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/09-docker.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/formacao-continuous-deployment-java-kubernetes-gcp-github-actions?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Continuous Deployment: do Zero ao Deploy com Java, Spring Boot, Docker, Kubernetes, Google Cloud (GCP) e GitHub Actions\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/29-cdpl-java-gcp.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/formacao-continuous-integration-delivery-java-aws-github-actions?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Continuous Integration e Delivery: do Zero ao Deploy com Java, Spring Boot, Docker, Amazon AWS e GitHub Actions\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/27-cicd-java-aws.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/formacao-continuous-integration-delivery-java-azure-github-actions?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Continuous Integration e Delivery: do Zero ao Deploy com Java, Spring Boot, Docker, Microsoft Azure e GitHub Actions\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/28-cicd-java-azure.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/meus-cursos?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Microsservi\u00e7os 2026: do 0 ao Deploy na Google Cloud com ASP.NET, .NET 10, Kubernetes e Docker\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/15-microservices-asp-net.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/asp-net-2026-do-0-a-azure-e-gcp-com-asp-net-10-docker-e-kubernetes?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o ASP.NET 2026: do Zero ao Deploy na Azure e GCP com .NET 10, Docker e Kubernetes\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/01-rest-asp-net.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/formacao-microsservicos-com-spring-cloud-spring-boot-kotlin-docker-e-zookeeper?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Forma\u00e7\u00e3o Microsservi\u00e7os com Spring Cloud, Spring Boot, Kotlin, Docker e Zookeeper\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/22-ms-kotlin.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/kotlin-para-desenvolvedores-java-domine-sintaxe-lambdas-generics-reflections-programacao-funcional-e-spring-boot?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Kotlin para DEV's Java: Domine Lambdas, Generics, Reflections, Programa\u00e7\u00e3o Funcional e Spring Boot\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/20-kotlin.png\">\n<\/a>\n\n<a href=\"https:\/\/pub.erudio.com.br\/crie-relatorios-profissionais-com-jasperreports-java-spring-boot-e-jaspersoft-studio?utm_source=blog-erudio&#038;utm_medium=organic&#038;utm_campaign=ollama-arquitetura&#038;utm_content=footer\" target=\"_blank\" rel=\"noopener\">\n  <img decoding=\"async\" style=\"max-width: 100%; display: block; margin-bottom: 8px;\" title=\"Crie Relat\u00f3rios Profissionais com JasperReports, Java, Spring Boot e JasperSoft Studio\" src=\"https:\/\/raw.githubusercontent.com\/leandrocgsi\/blog-images\/refs\/heads\/main\/formacoes_blog\/30-jasper.png\">\n<\/a>\n\n","protected":false},"excerpt":{"rendered":"<p>Se voc\u00ea j\u00e1 leu outros posts aqui no blog sobre Ollama, sabe que a ferramenta resolve um problema concreto: permitir que qualquer pessoa ou organiza\u00e7\u00e3o rode LLMs diretamente na pr\u00f3pria infraestrutura, sem enviar dados para servidores externos. Mas como exatamente isso funciona por dentro? O que acontece desde o momento em que voc\u00ea digita um [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":1945,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[387,410,422,404],"tags":[400,393,402,401],"_links":{"self":[{"href":"https:\/\/www.erudio.com.br\/blog\/wp-json\/wp\/v2\/posts\/1943"}],"collection":[{"href":"https:\/\/www.erudio.com.br\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.erudio.com.br\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.erudio.com.br\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.erudio.com.br\/blog\/wp-json\/wp\/v2\/comments?post=1943"}],"version-history":[{"count":1,"href":"https:\/\/www.erudio.com.br\/blog\/wp-json\/wp\/v2\/posts\/1943\/revisions"}],"predecessor-version":[{"id":1944,"href":"https:\/\/www.erudio.com.br\/blog\/wp-json\/wp\/v2\/posts\/1943\/revisions\/1944"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.erudio.com.br\/blog\/wp-json\/wp\/v2\/media\/1945"}],"wp:attachment":[{"href":"https:\/\/www.erudio.com.br\/blog\/wp-json\/wp\/v2\/media?parent=1943"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.erudio.com.br\/blog\/wp-json\/wp\/v2\/categories?post=1943"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.erudio.com.br\/blog\/wp-json\/wp\/v2\/tags?post=1943"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}