MemoryError no Python: Como resolver em minutos

Leandro Hirt

Atualizado em: 24/02/2026

Publicado em: 03/03/2026

Tempo de leitura: 10 minutos

Você está executando um script, processando um grande volume de dados ou carregando um dataset pesado e, de repente, o terminal exibe a temida mensagem: MemoryError. Esse erro é um dos mais frustrantes para quem está começando a aprender como programar, pois ele interrompe a execução do código sem um erro de sintaxe aparente. Basicamente, o MemoryError acontece quando o interpretador Python esgota a memória RAM disponível no sistema para realizar uma operação específica. Se o seu computador tem 8GB de RAM e você tenta carregar um arquivo de 10GB de uma só vez, o sistema não terá onde alocar esses dados e travará.

Entender como gerenciar recursos é uma habilidade vital para qualquer desenvolvedor sênior. O Python é uma linguagem de alto nível que facilita muito a escrita de código, mas essa facilidade às vezes esconde como a memória é manipulada nos bastidores. Diferente de linguagens como C ou C++, onde o programador aloca e libera memória manualmente, o Python utiliza um coletor de lixo (Garbage Collector) e o GIL (Global Interpreter Lock) para gerenciar o estado da aplicação. Quando esses mecanismos automáticos não são suficientes para lidar com o volume de objetos criados, o MemoryError surge como um mecanismo de defesa do sistema operacional.

O que causa o MemoryError no Python?

O MemoryError no Python não é um “bug” no código no sentido tradicional, mas sim um limite físico ou lógico sendo atingido. A causa mais comum é a tentativa de carregar estruturas de dados massivas de uma única vez. Por exemplo, ao ler um arquivo CSV gigante sem o uso de iteradores, o Python tenta colocar todas as linhas na memória RAM simultaneamente. Se você estiver trabalhando com arquivos CSV no Python, é essencial aprender a processá-los em pedaços (chunks).

Outra causa frequente é a arquitetura do interpretador. Se você estiver usando uma versão de 32 bits do Python, terá um limite de endereçamento de memória de aproximadamente 2GB a 4GB, independentemente de quanta RAM o seu computador possui. Utilizar versões de 64 bits é o primeiro passo para evitar limitações artificiais. Além disso, loops infinitos que criam objetos continuamente ou recursão excessiva sem uma condição de parada adequada podem devorar a memória em milissegundos.

Como resolver o MemoryError em minutos

A solução imediata para um MemoryError geralmente envolve mudar a forma como os dados são lidos. Em vez de ler todo o conteúdo de um arquivo com file.read(), utilize loops que processam linha por linha. Isso mantém apenas uma pequena fração do arquivo na memória por vez. Para quem trabalha com ciência de dados, o uso de bibliotecas otimizadas é obrigatório. A biblioteca Pandas no Python, por exemplo, oferece o parâmetro chunksize para carregar tabelas de forma fatiada.

Outra técnica rápida é verificar o uso de listas. Se você cria listas gigantescas apenas para iterar sobre elas uma vez, considere substituir por geradores. Geradores usam o conceito de “lazy evaluation” (avaliação preguiçosa), gerando o próximo item apenas quando solicitado, o que economiza uma quantidade massiva de memória RAM. Verifique também se há variáveis globais segurando dados que não são mais necessários e utilize a instrução del para removê-las explicitamente.

Uso de Geradores para economizar memória

Geradores são, talvez, a ferramenta mais poderosa para combater o MemoryError. Enquanto uma list comprehension no Python cria a lista inteira na memória antes de começar a usá-la, uma expressão geradora cria um objeto que sabe como gerar os itens sob demanda. Veja a diferença prática no código abaixo:

Python

# Isso pode causar MemoryError se o range for muito grande e convertido para lista
lista_gigante = [i for i in range(100000000)]

# Isso é seguro, pois gera um item por vez
gerador_seguro = (i for i in range(100000000))

# Isso pode causar MemoryError se o range for muito grande e convertido para lista
lista_gigante = [i for i in range(100000000)]

# Isso é seguro, pois gera um item por vez
gerador_seguro = (i for i in range(100000000))

A economia é drástica. No primeiro exemplo, o Python tenta reservar espaço para 100 milhões de inteiros de uma vez. No segundo, ele reserva espaço apenas para o objeto gerador e o inteiro atual que está sendo processado no loop. Segundo a documentação oficial do Python, geradores são uma forma elegante de escrever iteradores de maneira compacta.

Trabalhando com DataSets Grandes (Pandas e NumPy)

Quando falamos de análise de dados pesada, o NumPy no Python e o Pandas são os protagonistas. Entretanto, eles são conhecidos por consumir muita RAM se usados de forma ingênua. Uma técnica eficaz é especificar o tipo de dado (dtype) ao carregar colunas. Por padrão, o Pandas pode carregar um número inteiro pequeno como um int64, que ocupa 8 bytes. Se você sabe que seus números são pequenos, pode forçar o uso de int8 ou int16.

Python

import pandas as pd

# Carregando apenas colunas necessárias e definindo tipos menores
df = pd.read_csv('dados_gigantes.csv', usecols=['ID', 'Valor'], dtype={'ID': 'int32', 'Valor': 'float32'})

import pandas as pd

# Carregando apenas colunas necessárias e definindo tipos menores
df = pd.read_csv('dados_gigantes.csv', usecols=['ID', 'Valor'], dtype={'ID': 'int32', 'Valor': 'float32'})

Essa simples mudança pode reduzir o consumo de memória em mais de 50%. Além disso, sempre que possível, utilize o processamento em blocos. O processamento por blocos permite que você aplique funções a partes do arquivo, salve os resultados parciais em um banco de dados SQLite e limpe a memória antes de carregar o próximo bloco.

Gerenciando o contexto com a instrução with

Muitas vezes, esquecemos arquivos abertos ou conexões ativas que mantêm buffers de memória ocupados. O uso da instrução with para abrir arquivos garante que o recurso seja fechado e a memória liberada assim que o bloco de código for finalizado. Isso evita vazamentos de memória (memory leaks) que, acumulados ao longo de um script de automação longo, resultam em queda de performance ou travamentos.

Sempre prefira:

Python

with open('arquivo_pesado.txt', 'r') as arquivo:
    for linha in arquivo:
        processar(linha)

with open('arquivo_pesado.txt', 'r') as arquivo:
    for linha in arquivo:
        processar(linha)

Dessa forma, o Python lê o arquivo linha por linha (um buffer muito pequeno) e encerra o ponteiro do arquivo automaticamente ao final, mesmo que ocorra um erro durante o processamento.

Configurações do Sistema e Memória Virtual

Às vezes, o problema não está no código, mas no ambiente. Se você está executando scripts dentro de um ambiente virtual venv, certifique-se de que não há restrições de limites de memória impostas pelo sistema operacional ou pelo Docker, se estiver usando containers. No Windows, você pode aumentar o tamanho do arquivo de paginação (memória virtual), o que permite ao sistema “fingir” que tem mais RAM usando espaço do SSD ou HD. Embora isso torne o Python mais lento, pode ser a diferença entre o script terminar a tarefa ou falhar.

Outra dica importante é monitorar o consumo em tempo real. O módulo tracemalloc, nativo do Python, permite rastrear quais linhas de código estão alocando mais memória. Isso é fundamental para fazer o debug no Python quando o erro ocorre de forma intermitente em produção.

Exemplo Prático: Refatorando Código para evitar MemoryError

Imagine que você precise somar todos os números de um arquivo de texto que contém um número por linha, e o arquivo tem 20GB. Abaixo, mostramos a forma errada (que gera MemoryError) e a forma correta.

Abordagem Errada (Carregando em Lista)

Python

# Isso vai travar se o arquivo for muito grande
def soma_total(caminho_arquivo):
    with open(caminho_arquivo, 'r') as f:
        numeros = [int(linha) for linha in f.readlines()] # f.readlines() carrega TUDO na RAM
    return sum(numeros)

# Isso vai travar se o arquivo for muito grande
def soma_total(caminho_arquivo):
    with open(caminho_arquivo, 'r') as f:
        numeros = [int(linha) for linha in f.readlines()] # f.readlines() carrega TUDO na RAM
    return sum(numeros)

Abordagem Correta (Iteração Direta)

Python

# Isso funciona com arquivos de qualquer tamanho
def soma_total_eficiente(caminho_arquivo):
    soma = 0
    with open(caminho_arquivo, 'r') as f:
        for linha in f: # Lê uma linha por vez
            soma += int(linha)
    return soma

# Isso funciona com arquivos de qualquer tamanho
def soma_total_eficiente(caminho_arquivo):
    soma = 0
    with open(caminho_arquivo, 'r') as f:
        for linha in f: # Lê uma linha por vez
            soma += int(linha)
    return soma

No segundo exemplo, o consumo de memória será constante (perto de zero), independentemente se o arquivo tem 1MB ou 1TB. Essa é a essência de resolver problemas de memória: nunca peça ao computador para segurar mais do que ele precisa em um dado momento.

Uso de bibliotecas externas para Big Data

Se você está lidando com volumes de dados que realmente superam a capacidade de uma única máquina, talvez seja hora de olhar além do Python puro. Bibliotecas como Dask ou PySpark são projetadas para computação distribuída e gerenciamento inteligente de memória. Elas dividem as tarefas em grafos computacionais e executam as partes conforme a memória fica disponível, ou até distribuem o trabalho entre vários computadores. Para quem vem do Pandas, o Dask é especialmente amigável, pois imita a maioria de suas funções.

Além disso, o uso de formatos de arquivo binários e comprimidos, como Parquet ou HDF5, é muito mais eficiente do que arquivos de texto plano como CSV ou JSON. Esses formatos permitem a leitura seletiva de colunas e metadados, diminuindo drasticamente a carga inicial de dados desnecessários na RAM.

Perguntas Frequentes

O que significa MemoryError especificamente?

É uma exceção do Python que indica que o computador não conseguiu alocar mais memória RAM para completar uma operação solicitada pelo seu script.

Aumentar a RAM do PC resolve o MemoryError?

Pode ajudar temporariamente, mas se o seu algoritmo for ineficiente (ex: loops que duplicam dados), o erro voltará a ocorrer assim que o volume de dados aumentar novamente.

Por que meu script de 2GB de dados falha em um PC de 8GB?

O Python tem um “overhead”. Um objeto em Python (como um número ou string) ocupa mais espaço do que o dado puro. Além disso, o sistema operacional e outras abas do navegador também consomem parte dessa RAM.

O Python de 64 bits é melhor que o de 32 bits?

Sim. O Python de 32 bits está limitado a acessar no máximo 4GB de RAM. A versão de 64 bits pode acessar toda a memória disponível no seu sistema.

Como o comando del ajuda na memória?

O del remove a referência a uma variável. Se essa for a única referência ao objeto, o coletor de lixo poderá liberar esse espaço na memória mais rapidamente.

Usar funções ajuda a gerenciar memória?

Sim. Variáveis criadas dentro de uma função são locais. Quando a função termina, essas variáveis saem de escopo e são marcadas para exclusão, limpando a memória automaticamente.

Qual a diferença entre read() e readlines()?

Ambas podem causar MemoryError em arquivos grandes. O read() carrega o arquivo como uma única string, enquanto o readlines() carrega como uma lista de strings. O ideal é iterar diretamente sobre o objeto do arquivo.

O erro pode ser causado por vazamento de memória?

Sim. Se você armazena objetos em listas globais e nunca os remove, a memória vai encher aos poucos até causar o erro, mesmo que o processamento pareça simples.

Resolver um MemoryError exige uma mudança de mentalidade: saia do carregamento em massa para o processamento em fluxo. Ao aplicar geradores, otimizar tipos de dados em bibliotecas como Pandas e utilizar corretamente os contextos de arquivos, você garante que seus scripts sejam robustos e escaláveis. Se você deseja aprofundar seus conhecimentos em diagnósticos de código, confira como realizar o debug no VS Code para iniciantes e domine suas ferramentas de desenvolvimento.

Compartilhe:

MemoryError no Python: Como resolver em minutos

O que causa o MemoryError no Python?

Como resolver o MemoryError em minutos

Uso de Geradores para economizar memória

Trabalhando com DataSets Grandes (Pandas e NumPy)

Gerenciando o contexto com a instrução with

Configurações do Sistema e Memória Virtual

Exemplo Prático: Refatorando Código para evitar MemoryError

Abordagem Errada (Carregando em Lista)

Abordagem Correta (Iteração Direta)

Uso de bibliotecas externas para Big Data

Perguntas Frequentes

O que significa MemoryError especificamente?

Aumentar a RAM do PC resolve o MemoryError?

Por que meu script de 2GB de dados falha em um PC de 8GB?

O Python de 64 bits é melhor que o de 32 bits?

Como o comando del ajuda na memória?

Usar funções ajuda a gerenciar memória?

Qual a diferença entre read() e readlines()?

O erro pode ser causado por vazamento de memória?

Conteúdo do artigo

Artigos relacionados

PermissionError no Python: Como resolver em 2 minutos

Como ler variáveis de ambiente em Python sem erro

Como publicar seu pacote Python no PyPI em 5 min

Descubra o Que é o GIL e Por Que ele Trava seu Python

Erro de Sintaxe no Python: Como identificar e corrigir rápido

ImportError no Python? Descubra como corrigir em 2 minutos

Domine Python do Básico ao Avançado

Links rápidos

Blog

Redes sociais