MLflow: Gerenciando o Ciclo de Vida de Machine Learning — do Experimento à Produção

O Desafio do Ciclo de Vida de ML

Desenvolver modelos de Machine Learning vai muito além de treinar um algoritmo com bons dados. Em projetos reais, um time de Data Science enfrenta dezenas — quando não centenas — de experimentos: diferentes hiperparâmetros, conjuntos de features variados, versões de código distintas. Sem uma ferramenta adequada, rapidamente se perde o rastro do que funcionou, por que funcionou e como reproduzir aquele resultado. Foi pensando nisso que a Databricks criou o MLflow, uma plataforma open-source que unifica todo o ciclo de vida de ML.

O MLflow não é um framework de ML nem um orquestrador de pipelines. Ele é um meta-framework que funciona com qualquer biblioteca (scikit-learn, TensorFlow, PyTorch, XGBoost) e em qualquer infraestrutura (local, cloud, Kubernetes). Seus quatro componentes principais resolvem problemas específicos que todo time de Data Science enfrenta.

MLflow Tracking: O Diário de Bordo dos Experimentos

O componente mais utilizado do MLflow é o Tracking. Ele permite registrar parâmetros, métricas, artefatos e metadados de cada execução de treinamento. Tudo fica organizado em uma interface web ou em arquivos locais, acessível para consulta e comparação.

import mlflow
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

mlflow.set_experiment("Classificacao_Churn")

with mlflow.start_run():
    # Log de hiperparametros
    mlflow.log_param("n_estimators", 100)
    mlflow.log_param("max_depth", 10)
    mlflow.log_param("criterion", "gini")

    # Treinamento
    model = RandomForestClassifier(n_estimators=100, max_depth=10)
    model.fit(X_train, y_train)
    preds = model.predict(X_test)

    # Log de metricas
    acc = accuracy_score(y_test, preds)
    mlflow.log_metric("accuracy", acc)
    mlflow.log_metric("f1_score", f1)

    # Log do modelo
    mlflow.sklearn.log_model(model, "random_forest_churn")
    # Log de artefatos
    mlflow.log_artifact("confusion_matrix.png")

Com poucas linhas de código, cada experimento fica documentado automaticamente. A interface web do MLflow permite comparar runs lado a lado, filtrar por métricas e identificar rapidamente o melhor modelo.

MLflow Projects: Reproducibilidade Garantida

Quantas vezes você já tentou reproduzir um experimento de semanas atrás e não conseguiu porque esqueceu qual versão da biblioteca foi usada? O MLflow Projects resolve isso ao empacotar código, dependências e configurações em um formato padronizado.

# MLproject
name: ChurnPrediction
conda_env: conda.yaml

entry_points:
  main:
    parameters:
      n_estimators: {type: int, default: 100}
      max_depth: {type: int, default: 10}
    command: "python train.py --n_estimators {n_estimators} --max_depth {max_depth}"

O arquivo MLproject define os entry points e as dependências (via conda.yaml ou requirements.txt). Com isso, qualquer pessoa — ou máquina — pode executar o mesmo experimento em qualquer ambiente e obter o mesmo resultado. Isso é fundamental para auditoria e conformidade em ambientes regulados.

MLflow Models: Formatos Padronizados para Implantação

Um dos maiores gargalos em produção é a diversidade de formatos de modelo. Cada framework salva o modelo de um jeito diferente, e cada ferramenta de deploy espera um formato específico. O MLflow Models padroniza isso com o formato MLmodel, que encapsula o modelo, suas dependências e instruções de carregamento.

# Estrutura de um MLflow Model
model_dir/
├── MLmodel          # Metadados do modelo
├── conda.yaml       # Dependências Conda
├── requirements.txt # Dependências pip
├── python_env.yaml  # Ambiente Python
└── model.pkl        # Artefato do modelo serializado

O MLflow oferece "sabores" (flavors) para os principais frameworks — mlflow.sklearn, mlflow.pytorch, mlflow.keras — garantindo que o modelo seja carregado corretamente independente de quem o criou.

MLflow Registry: Governança de Modelos em Produção

Quando um time gerencia dezenas de modelos em produção, saber qual versão está em staging, qual está em produção e qual deve ser descontinuada vira um caos. O Model Registry resolve isso com um catálogo centralizado com estágios do ciclo de vida.

# Registrando um modelo
mlflow.register_model(
    "runs://random_forest_churn",
    "ChurnPredictionModel"
)

# Promovendo para produção via API
from mlflow.tracking import MlflowClient
client = MlflowClient()
client.transition_model_version_stage(
    name="ChurnPredictionModel",
    version=3,
    stage="Production"
)

Os estágios padrão são: Staging (testes e validação), Production (implantado e servindo), Archived (descontinuado). Cada transição pode ser registrada com comentários, criando um audit trail completo.

Colocando em Prática: Pipeline Completo

A verdadeira força do MLflow aparece quando combinamos todos os componentes em um pipeline:

Tracking registra cada execução durante a fase de experimentação
Projects empacota o código do modelo vencedor com suas dependências
Models serializa o modelo em formato padronizado
Registry gerencia as versões e promoções até produção

Esse fluxo pode ser automatizado com CI/CD. Por exemplo: um trigger no GitHub Actions treina o modelo, registra no MLflow, promove para staging se as métricas passarem nos thresholds, e um humano aprova a promoção para produção via interface web.

MLflow na Prática: Deploy com Docker

Para servir modelos em produção, o MLflow oferece uma API REST nativa. Com um comando, você sobe um servidor que aceita requisições de inferência:

# Servindo modelo localmente
mlflow models serve -m "models:/ChurnPredictionModel/Production" --port 5001

# Ou via Docker
mlflow models build-docker -m "models:/ChurnPredictionModel/Production" -n "churn-api:latest"
docker run -p 5001:8080 churn-api:latest

A requisição de inferência é uma simples chamada HTTP POST com JSON:

curl -X POST http://localhost:5001/invocations \
  -H "Content-Type: application/json" \
  -d '{"inputs": {"idade": 35, "saldo": 5000, "transacoes": 12}}'

Conclusão

O MLflow se consolidou como o padrão de facto para gerenciamento do ciclo de vida de Machine Learning, com mais de 15 milhões de downloads mensais e adoção por empresas como Atlassian, Siemens e Adobe. Ele resolve problemas reais de reprodução, colaboração e governança sem amarrar o time a um framework ou provedor específico. Se você trabalha com Data Science em equipe — ou mesmo sozinho em projetos complexos — o MLflow é uma ferramenta que vale muito a pena dominar.

Data science

Entrar em contato

Entre em contato