Como usar multiprocessing em Python e acelerar seu script

Leandro Hirt

Atualizado em: 10/03/2026

Publicado em: 15/03/2026

Tempo de leitura: 11 minutos

Você já sentiu que seu computador tem muito mais poder do que o seu código está realmente utilizando? Se você trabalha com processamento de grandes volumes de dados ou cálculos complexos, provavelmente já percebeu que o Python, por padrão, executa tarefas de forma sequencial. Isso significa que ele usa apenas um núcleo do seu processador por vez. Se você quer aprender como usar multiprocessing em Python e acelerar seu script, este guia explicará como desbloquear o verdadeiro potencial da sua máquina. Ao utilizar múltiplos processos simultâneos, tarefas que levavam minutos podem ser concluídas em segundos, aproveitando cada centavo investido no seu hardware.

O que é Multiprocessing e por que ele é necessário?

O multiprocessing é uma técnica de programação que permite que um script execute várias tarefas ao mesmo tempo, distribuindo-as entre os diferentes núcleos (cores) da Unidade Central de Processamento (CPU). Imagine que você tem uma fábrica com oito máquinas, mas apenas um funcionário operando uma delas enquanto as outras sete ficam paradas. O multiprocessing é o equivalente a contratar mais funcionários para que todas as máquinas trabalhem juntas.

No ecossistema desta linguagem, existe um conceito chamado Global Interpreter Lock (GIL). Muitos desenvolvedores buscam entender o que é GIL e por que ele trava o Python, pois esse mecanismo impede que múltiplas threads executem código Python simultaneamente em um único processo. Para contornar essa limitação e obter um ganho real de performance em tarefas pesadas de CPU, o módulo multiprocessing cria novos processos independentes, cada um com seu próprio interpretador e espaço de memória.

Se você notar que seu Python está lento, existem diversas dicas de otimização, mas poucas são tão drásticas e eficazes quanto a migração para um modelo multinúcleo. Ao contrário do threading, que é melhor para operações de entrada e saída (E/S) como baixar arquivos, o multiprocessing é o rei para processamento matemático e manipulação intensiva de dados.

Como usar multiprocessing em Python e acelerar seu script: Primeiros Passos

Para começar a usar o paralelismo, não é necessário instalar bibliotecas externas complexas; o Python já traz o módulo multiprocessing de forma nativa. O conceito principal gira em torno da classe Process e do objeto Pool. O Pool é particularmente útil porque ele gerencia um conjunto de processos trabalhadores para você, distribuindo as tarefas automaticamente.

Antes de mergulhar no código, é importante garantir que seu ambiente virtual venv no Python esteja configurado corretamente para evitar conflitos de versões. Com o ambiente pronto, o primeiro passo é definir a função que será executada em paralelo. É essencial que essa função seja independente, ou seja, ela não deve depender de variáveis globais que mudam o tempo todo, pois processos diferentes não compartilham a mesma memória facilmente.

Configurando a estrutura básica

O código abaixo mostra a estrutura fundamental para iniciar um processo separado. Repare no uso obrigatório do bloco if __name__ == "__main__":. Sem isso, seu script pode entrar em um loop infinito de criação de processos no Windows.

Python

import multiprocessing

def tarefa_pesada(nome):
    print(f"Executando tarefa para {nome}")

if __name__ == "__main__":
    p = multiprocessing.Process(target=tarefa_pesada, args=("Processo_1",))
    p.start()
    p.join()

import multiprocessing

def tarefa_pesada(nome):
    print(f"Executando tarefa para {nome}")

if __name__ == "__main__":
    p = multiprocessing.Process(target=tarefa_pesada, args=("Processo_1",))
    p.start()
    p.join()

Diferença entre Multiprocessing e Threading

Uma dúvida comum é quando usar threads e quando usar processos. As threads compartilham o mesmo espaço de memória, o que as torna leves, mas as sujeita ao GIL. Já os processos são cópias completas do programa. Se o seu script trava com threading no Python, pode ser porque você está tentando realizar cálculos matemáticos pesados que o GIL não consegue paralelizar bem.

De forma resumida, use o módulo threading para tarefas de rede, leitura de disco ou interação com o usuário. Use multiprocessing para análise de dados, renderização de imagens, criptografia ou qualquer algoritmo na programação que exija esforço contínuo do processador. Para referências técnicas aprofundadas sobre o assunto, você pode consultar a documentação oficial do Python ou ler sobre computação paralela na Wikipédia.

Usando o Pool de Processos para escalabilidade

O verdadeiro poder de como usar multiprocessing em Python e acelerar seu script aparece quando usamos o Pool. Ele permite mapear uma função sobre uma lista de dados, dividindo o trabalho automaticamente entre os núcleos disponíveis. Se você tem 1.000 imagens para redimensionar, o Pool enviará, por exemplo, 250 para cada um dos seus 4 núcleos.

Imagine que você está usando a biblioteca Pillow para redimensionar imagens com Python. Fazer isso uma por uma é lento. Com o Pool, o tempo total cai proporcionalmente ao número de núcleos do seu PC.

Exemplo prático com Pool.map()

Python

from multiprocessing import Pool
import time

def calcular_quadrado(n):
    return n * n

if __name__ == "__main__":
    numeros = [1, 2, 3, 4, 5, 10, 20, 50]
    
    with Pool(processes=4) as pool:
        resultados = pool.map(calcular_quadrado, numeros)
    
    print(resultados)

from multiprocessing import Pool
import time

def calcular_quadrado(n):
    return n * n

if __name__ == "__main__":
    numeros = [1, 2, 3, 4, 5, 10, 20, 50]
    
    with Pool(processes=4) as pool:
        resultados = pool.map(calcular_quadrado, numeros)
    
    print(resultados)

Identificando gargalos antes de paralelizar

Nem todo script deve ser paralelizado. Criar um novo processo consome tempo e memória (overhead). Se a tarefa for muito simples, o tempo gasto para criar o processo será maior do que o tempo de execução da tarefa em si. Por isso, é vital usar ferramentas como o cProfile. Aprender a usar o cProfile para identificar gargalos no Python ajudará você a decidir se o multiprocessing é realmente a solução.

Muitas vezes, a lentidão não está na CPU, mas na forma como você lida com listas. Às vezes, entender a diferença de list comprehension vs generator expression pode economizar tanta memória que a necessidade de paralelismo diminui. Contudo, para processamento bruto, o multiprocessing continua sendo imbatível.

Tratamento de Erros e Memória em Multiprocessing

Trabalhar com múltiplos processos traz desafios novos. Se um processo falha, ele pode não exibir o erro no console principal facilmente. Além disso, como cada processo carrega sua própria cópia dos dados, é fácil estourar a memória RAM da máquina. Se você encontrar um MemoryError no Python e precisar resolver, verifique se não está carregando arquivos gigantescos dentro de cada processo do Pool.

Uma boa prática é passar apenas os caminhos dos arquivos ou referências pequenas para os processos, e deixar que cada processo abra o arquivo individualmente apenas quando necessário. Isso mantém o consumo de memória sob controle e evita que o sistema operacional encerre seu script por falta de recursos.

Compartilhamento de dados entre processos

Como mencionamos, processos não compartilham memória. Se você precisa que o Processo A diga algo para o Processo B, você deve usar mecanismos específicos como Queue (Filas) ou Pipe (Canos). O multiprocessing.Queue funciona como uma fila de banco, onde um processo coloca dados no fim da fila e outro os retira do início. Isso é seguro para threads e processos e evita a corrupção de dados.

Recurso	Uso Recomendado	Vantagem
Queue	Troca de mensagens simples	Seguro e fácil de usar
Value/Array	Dados numéricos compartilhados	Rápido para dados simples
Manager	Dicionários e listas complexas	Flexível para objetos Python

Exemplo Prático: Acelerando o Processamento de Dados

Vamos criar um projeto que simula um processamento pesado, como a análise de grandes volumes de texto ou cálculos de funções matemáticas complexas no Python. Dividiremos o código em etapas para facilitar o entendimento.

1. Definindo a função de trabalho

Nesta etapa, criamos a função que simula um cálculo que exige muito processamento. Usaremos time.sleep apenas para simular o tempo de espera do CPU em uma tarefa real.

Python

import time

def tarefa_intensiva(x):
    # Simula um cálculo complexo
    resultado = 0
    for i in range(1000000):
        resultado += i * x
    return resultado

import time

def tarefa_intensiva(x):
    # Simula um cálculo complexo
    resultado = 0
    for i in range(1000000):
        resultado += i * x
    return resultado

2. Executando de forma sequencial (Lenta)

Aqui vemos como o script se comporta sem o multiprocessing. Ele processará um item por vez.

Python

def rodar_sequencial(dados):
    inicio = time.time()
    resultados = [tarefa_intensiva(item) for item in dados]
    fim = time.time()
    print(f"Tempo Sequencial: {fim - inicio:.2f} segundos")

def rodar_sequencial(dados):
    inicio = time.time()
    resultados = [tarefa_intensiva(item) for item in dados]
    fim = time.time()
    print(f"Tempo Sequencial: {fim - inicio:.2f} segundos")

3. Executando com Multiprocessing (Rápida)

Agora invocamos o Pool para distribuir a mesma carga de trabalho pelos núcleos da CPU.

Python

from multiprocessing import Pool

def rodar_paralelo(dados):
    inicio = time.time()
    with Pool() as pool:
        resultados = pool.map(tarefa_intensiva, dados)
    fim = time.time()
    print(f"Tempo Paralelo: {fim - inicio:.2f} segundos")

from multiprocessing import Pool

def rodar_paralelo(dados):
    inicio = time.time()
    with Pool() as pool:
        resultados = pool.map(tarefa_intensiva, dados)
    fim = time.time()
    print(f"Tempo Paralelo: {fim - inicio:.2f} segundos")

Código Completo do Projeto

Abaixo está o código unificado que você pode copiar e testar no seu computador para ver a diferença de performance imediata. Certifique-se de fechar programas pesados para que todos os núcleos estejam disponíveis para o teste.

Python

import multiprocessing
from multiprocessing import Pool
import time

# Função que simula processamento pesado de CPU
def tarefa_intensiva(x):
    contador = 0
    for i in range(5000000):
        contador += i + x
    return contador

def executar_testes():
    dados = [10, 20, 30, 40, 50, 60, 70, 80]
    
    print("Iniciando execução sequencial...")
    inicio_seq = time.time()
    res_seq = [tarefa_intensiva(d) for d in dados]
    fim_seq = time.time()
    print(f"Tempo total sequencial: {fim_seq - inicio_seq:.4f} segundos")
    
    print("\nIniciando execução paralela (Multiprocessing)...")
    # Pool() sem argumentos usa o número total de CPUs da máquina
    inicio_par = time.time()
    with Pool() as pool:
        res_par = pool.map(tarefa_intensiva, dados)
    fim_par = time.time()
    print(f"Tempo total paralelo: {fim_par - inicio_par:.4f} segundos")
    
    ganho_performance = (fim_seq - inicio_seq) / (fim_par - inicio_par)
    print(f"\nO script paralelo foi {ganho_performance:.2f}x mais rápido!")

if __name__ == "__main__":
    # Garantir que o Windows gerencie corretamente a criação de processos
    executar_testes()

import multiprocessing
from multiprocessing import Pool
import time

# Função que simula processamento pesado de CPU
def tarefa_intensiva(x):
    contador = 0
    for i in range(5000000):
        contador += i + x
    return contador

def executar_testes():
    dados = [10, 20, 30, 40, 50, 60, 70, 80]
    
    print("Iniciando execução sequencial...")
    inicio_seq = time.time()
    res_seq = [tarefa_intensiva(d) for d in dados]
    fim_seq = time.time()
    print(f"Tempo total sequencial: {fim_seq - inicio_seq:.4f} segundos")
    
    print("\nIniciando execução paralela (Multiprocessing)...")
    # Pool() sem argumentos usa o número total de CPUs da máquina
    inicio_par = time.time()
    with Pool() as pool:
        res_par = pool.map(tarefa_intensiva, dados)
    fim_par = time.time()
    print(f"Tempo total paralelo: {fim_par - inicio_par:.4f} segundos")
    
    ganho_performance = (fim_seq - inicio_seq) / (fim_par - inicio_par)
    print(f"\nO script paralelo foi {ganho_performance:.2f}x mais rápido!")

if __name__ == "__main__":
    # Garantir que o Windows gerencie corretamente a criação de processos
    executar_testes()

Dicas avançadas para otimização

Ao implementar como usar multiprocessing em Python e acelerar seu script, considere o número de processos. Nem sempre usar o máximo de núcleos é a melhor escolha. Se você estiver fazendo web scraping com BeautifulSoup e Requests, por exemplo, o gargalo será sua conexão de internet, não a CPU. Nesses casos, o threading ou asyncio podem ser mais eficientes.

Outra dica é usar o parâmetro chunksize no pool.map(). Se você tem milhões de tarefas pequenas, enviar uma de cada vez para os processos gera muito custo de comunicação. O chunksize permite enviar “pacotes” de tarefas, o que aumenta drasticamente a velocidade em listas gigantescas.

Se o seu projeto crescer e você precisar rodar em servidores diferentes, considere usar o Docker para rodar scripts Python, garantindo que as dependências de multiprocessamento funcionem da mesma forma no seu computador e na nuvem.

Perguntas Frequentes

O multiprocessing funciona no Windows e Linux da mesma forma?

Quase. No Linux, o processo é criado via ‘fork’, que é muito rápido. No Windows, ele usa ‘spawn’, que inicia um novo interpretador do zero, sendo um pouco mais lento para iniciar e exigindo obrigatoriamente o bloco “if name == ‘main’:”.

Quantos processos devo criar no Pool?

O ideal é que o número de processos seja igual ou ligeiramente menor que o número de núcleos físicos da sua CPU. Usar multiprocessing.cpu_count() ajuda a automatizar essa escolha.

Posso usar multiprocessing para ler arquivos Excel?

Sim! Ao lidar com Python para Excel, você pode carregar diferentes abas ou diferentes arquivos em processos separados para acelerar a leitura e o processamento dos dados.

Qual a diferença entre map e apply_async?

O map bloqueia o script até que todos os resultados retornem e mantém a ordem. O apply_async não bloqueia e permite que você recupere os resultados conforme eles ficam prontos, de forma assíncrona.

O multiprocessing compartilha variáveis globais?

Não. Cada processo recebe uma cópia do ambiente. Se você mudar uma variável global no Processo A, ela continuará com o valor original no Processo B e no processo principal.

Por que meu script ficou mais lento com multiprocessing?

Isso acontece se a tarefa for muito rápida. O tempo de criar e destruir processos superou o tempo de execução da tarefa. Use apenas para tarefas que levam pelo menos alguns décimos de segundo.

Multiprocessing ajuda em tarefas de rede (APIs)?

Geralmente não. Para chamadas de API ou banco de dados, o asyncio no Python ou threading são mais indicados, pois os núcleos ficam apenas esperando a resposta da rede.

Como depurar erros em subprocessos?

Erros em processos secundários podem ser silenciosos. Uma dica é usar blocos try-except dentro da função de trabalho e usar o módulo logging do Python para gravar erros em um arquivo de log centralizado.

Dominar o uso de múltiplos núcleos transformará a maneira como você escreve automações e sistemas de processamento de dados. Ao aplicar essas técnicas, você não apenas economiza tempo, mas também permite que o Python lide com desafios de escala que antes pareciam impossíveis para uma linguagem interpretada. Comece testando o Pool em suas funções mais lentas e observe o desempenho saltar.

Compartilhe:

Como usar multiprocessing em Python e acelerar seu script

O que é Multiprocessing e por que ele é necessário?

Como usar multiprocessing em Python e acelerar seu script: Primeiros Passos

Configurando a estrutura básica

Diferença entre Multiprocessing e Threading

Usando o Pool de Processos para escalabilidade

Exemplo prático com Pool.map()

Identificando gargalos antes de paralelizar

Tratamento de Erros e Memória em Multiprocessing

Compartilhamento de dados entre processos

Exemplo Prático: Acelerando o Processamento de Dados

1. Definindo a função de trabalho

2. Executando de forma sequencial (Lenta)

3. Executando com Multiprocessing (Rápida)

Código Completo do Projeto

Dicas avançadas para otimização

Perguntas Frequentes

O multiprocessing funciona no Windows e Linux da mesma forma?

Quantos processos devo criar no Pool?

Posso usar multiprocessing para ler arquivos Excel?

Qual a diferença entre map e apply_async?

O multiprocessing compartilha variáveis globais?

Por que meu script ficou mais lento com multiprocessing?

Multiprocessing ajuda em tarefas de rede (APIs)?

Como depurar erros em subprocessos?

Conteúdo do artigo

Artigos relacionados

Descubra como criar geradores eficientes com yield no Python

Descubra o Que é o GIL e Por Que ele Trava seu Python

Como criar um cliente TCP simples em Python

Por que seu script trava? Descubra o Threading no Python

Decoradores em Python: O que são e como usar

Regex Python: Tudo Sobre Expressões Regulares

Domine Python do Básico ao Avançado

Links rápidos

Blog

Redes sociais