Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Simulação de Dados de Teste A/B | Análise Prática, Interpretação e Relatório
Testes A/B com Python

Simulação de Dados de Teste A/B

Deslize para mostrar o menu

Simular dados de teste A/B é uma habilidade valiosa para quem está aprendendo sobre experimentação e análise. Ao gerar conjuntos de dados sintéticos, é possível praticar técnicas estatísticas, testar fluxos de análise e experimentar diferentes cenários sem a necessidade de acessar dados reais de usuários. Dados sintéticos são especialmente úteis para o aprendizado, pois permitem controlar parâmetros-chave, como tamanhos dos grupos e taxas de conversão, além de possibilitar a repetição de experimentos sob condições conhecidas. Isso facilita a compreensão do impacto de diversos fatores nos resultados e o desenvolvimento de habilidades analíticas em um ambiente livre de riscos.

1234567891011121314151617181920212223242526272829303132333435363738394041
import numpy as np import pandas as pd # Set random seed for reproducibility np.random.seed(42) # Define number of users per group n_users = 1000 # Define conversion rates for group A and B conversion_rate_A = 0.10 # 10% conversion_rate_B = 0.13 # 13% # Generate user IDs user_ids = np.arange(1, 2 * n_users + 1) # Randomly assign users to groups groups = np.array(['A'] * n_users + ['B'] * n_users) np.random.shuffle(groups) # Assign conversions based on group-specific rates conversions = [] for group in groups: if group == 'A': conversions.append(np.random.binomial(1, conversion_rate_A)) else: conversions.append(np.random.binomial(1, conversion_rate_B)) # Create DataFrame data = pd.DataFrame({ 'user_id': user_ids, 'group': groups, 'converted': conversions }) # Show the first few rows print(data.head()) # To adjust for different scenarios: # - Change n_users for sample size # - Modify conversion_rate_A or conversion_rate_B for different effect sizes

Após gerar os dados simulados do teste A/B, é importante validar se o conjunto de dados corresponde ao cenário desejado. Primeiro, verifique se o número de usuários em cada grupo está equilibrado ou conforme o esperado para o seu desenho experimental. Em seguida, calcule as taxas de conversão observadas para cada grupo para garantir que estejam próximas das taxas especificadas. Também é recomendável revisar o conjunto de dados em busca de entradas ausentes ou duplicadas e verificar se todos os usuários possuem uma atribuição de grupo e um resultado válidos. Essa etapa de validação garante que os dados sintéticos sejam realistas e confiáveis para a prática de análise.

question mark

Qual das alternativas a seguir é um possível problema que você pode encontrar ao validar dados simulados de um teste A/B?

Selecione a resposta correta

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 1

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 4. Capítulo 1
some-alt