

Incerto onde
começar?
Track
Certificado
Preparation for Data Science
4.7+
★★★★★
★★★★★
1033 avaliações
Intermediate
Track curriculum encompasses a collection of pivotal courses that provide foundational knowledge and skills essential for a successful journey in the field of data science. These courses encompass the comprehensive study of key concepts, tools, and methodologies integral to the realm of data analysis and modeling. Mostre mais
python
Boost your Tech Skills!
with up to 55% off
What you'll get with our subscription:
Access to 85+ top-rated courses
AI-driven Learning
Workspaces for practicing your skills
Personalized study tracks
Certificates of completion
Training 2 or more people?
Get your team access to Codefinity courses anytime, anywhere.
Try Codefinity TeamsTrusted by employees of leading companies
Learning track content
Module 2 / NumPy in a Nutshell
In this section we will get acquainted with what the NumPy library is, as well as learn how to create an array.
In this section we will get acquainted with arrays of different dimensions, and understand the difference between them.
In this section we should recall what slices are and learn how to make them for arrays of different dimensions. We shall also learn to refer to elements in an array using their indexes.
- Access Array ElementsPré-visualização
- Match Math OperationsPré-visualização
- Access 2-D and 3-D ArraysPré-visualização
- Match the SlicingPré-visualização
- Negative IndexingPré-visualização
- Match the IndicesPré-visualização
- Get One Dimensional Array Using Slice and Only Positive IndexesPré-visualização
- Get One Dimensional Array Using Only Negative IndexesPré-visualização
In this section we will learn how to reshape arrays and also how to concatenate an array. Moreover we will learn how to sort an array. Also we will learn about such an interesting method that is often used for arrays, namely: copy().
Module 3 / Getting into NumPy Basics
In this project, we will delve into the fundamentals of NumPy, exploring its core features and uncovering the reasons behind its significant impact on scientific computing.
Module 4 / Primeiros Passos com Pandas
Nesta seção, exploraremos os fundamentos das estruturas Series e DataFrame. Você também aprenderá sobre as distinções entre esses dois tipos de estruturas.
- O Que É Pandas?Pré-visualização
- SériesPré-visualização
- Desafio: Criando uma SériePré-visualização
- Quadro de DadosPré-visualização
- Quiz: Criando uma SériePré-visualização
- Quiz: Criando um DataFramePré-visualização
- Adicionando uma Nova ColunaPré-visualização
- Inserindo uma Nova ColunaPré-visualização
- Excluindo uma Linha/ColunaPré-visualização
- Quiz: Correspondência das FunçõesPré-visualização
- Trabalhando com ColunasPré-visualização
- Quiz: Extraindo ColunasPré-visualização
- Conceitos Básicos de ilocPré-visualização
- Desafio: Usando ilocPré-visualização
Os dados podem ser obtidos em vários formatos, como CSV, JSON, SQL, HTML e mais. Com o Pandas, você não está limitado a um único formato — você pode trabalhar com dados em uma variedade de tipos de arquivos. Neste capítulo, vamos nos concentrar especificamente nos formatos CSV e TXT.
Aqui, você aprenderá a processar dados brutos removendo informações desnecessárias e gerenciando valores nulos em um conjunto de dados.
- Visualizando os DadosPré-visualização
- Quiz: Usando HeadPré-visualização
- Quiz: Head, Tail e SamplePré-visualização
- Explorando o Conjunto de DadosPré-visualização
- Nomes das Colunas e Tipos de DadosPré-visualização
- Encontrando Valores NulosPré-visualização
- Quiz: Identificando Valores NulosPré-visualização
- Desafio: Eliminando Valores NulosPré-visualização
- Desafio: Preenchendo Valores NulosPré-visualização
- Quiz: Valores NulosPré-visualização
- Descrevendo os DadosPré-visualização
- Max() e Min()Pré-visualização
- Quiz: Operações EstatísticasPré-visualização
- Sum() e Count()Pré-visualização
- Valores ÚnicosPré-visualização
Module 5 / Advanced Techniques in pandas
This section will teach you how to output specific columns by their titles or indices. Also, you will get acquainted with the ways you can select rows by indices.
Here, you will learn how to extract data that has specific conditions. Also, you will learn how to combine them and even create your own.
In this section, you will expand your knowledge on setting different data conditions. You will learn to check if your data is in a defined list of values or between two values. You will also learn how to find the largest and smallest values.
This section is one of the most fascinating of the course. Here, you will learn how to group data in different ways. It will help you work as a data analyst to find out information on specific data groups.
This section is one of the most significant for a data analyst because if the data contains missing data values in the incorrect format, it will be impossible to work with. Thus, you will learn how to deal with such inappropriate values here.
- Checking for Missing ValuesPré-visualização
- Calculating the Number of Missing ValuesPré-visualização
- What Will We Do With the NaN Values?Pré-visualização
- How to Delete Only NaN Values?Pré-visualização
- Filling In the Missing ValuesPré-visualização
- Managing Categorical VariablesPré-visualização
- Checking the Column TypePré-visualização
- Managing an Incorrect ColumnPré-visualização
- Renaming the ColumnPré-visualização
Module 6 / Unveiling the Power of Data Manipulation with Pandas
In this project, we are going to understand what Pandas is and why it is so powerful.
Module 7 / Mathematics for Data Analysis and Modeling
Let's start with some basic definitions and concepts we'll use later. Consider the idea of a function, a numerical sequence, and its sum, and also understand what a coordinate system's basis is.
The simplest and most commonly used type of relationship is the linear relationship. Linear algebra is a branch of higher mathematics entirely devoted to linear functions and linear spaces. Let's look at some of the most important topics in linear algebra: vectors, matrices, solving linear equations, and solving the spectral problem for matrices.
- Numerical Operations on Vectors and MatricesPré-visualização
- Challenge: Calculate the Matrix Multiplication ResultPré-visualização
- Matrix DeterminantPré-visualização
- Scaling Factor of the Linear TransformationPré-visualização
- Challenge: Figures' Linear TransformationsPré-visualização
- Inversed and Transposed MatricesPré-visualização
- System of Linear EquationsPré-visualização
- Challenge: Solving the Task Using SLEPré-visualização
- Eigenvalues and EigenvectorsPré-visualização
Mathematical analysis is a discipline that allows you to analyze functions according to various criteria. Consider how to check numerical sequences for convergence, find the maximum/minimum values of functions, solve nonlinear equations, and use integrals to solve applied problems.
- Derivative of the FunctionPré-visualização
- Partial Derivative of the FunctionPré-visualização
- Challenge: Solving Task Using DerivativePré-visualização
- Optimization ProblemPré-visualização
- Challenge: Solving the Optimisation ProblemPré-visualização
- Gradient Descent MethodPré-visualização
- Challenge: Optimising Function Of Multiple VariablesPré-visualização
Module 8 / Probability Theory Basics
We will start our way of learning probability theory by considering some basic definitions and rules: what is a stochastic experiment and random event, what is independence and incompatibility of events in the context of probability theory, what is the probability and how can we calculate probabilities of different elementary events.
- Stochastic Experiment and Random EventPré-visualização
- Probability and It's PropertiesPré-visualização
- Geometrical ProbabilityPré-visualização
- Challenge: Solving the Task Using Geometric ProbabilityPré-visualização
- Independence and Incompatibility of Random EventsPré-visualização
- Conditional ProbabilityPré-visualização
In real-life tasks, we often have to deal with complex relationships and, as a result, calculate probabilities of several events or events that depend on each other. Let's consider how we can do this using probability theory.
- Inclusion-Exclusion PrinciplePré-visualização
- Challenge: Solving the Task Using Inclusion-Exclusion PrinciplePré-visualização
- The Multiplication Rule of ProbabilityPré-visualização
- Law of Total ProbabilityPré-visualização
- Bayes' TheoremPré-visualização
- Challenge: Solving the Task Using Bayes' TheoremPré-visualização
To solve many real problems in probability theory, special models have been created that describe a particular situation. Let's consider some of the most used models that can be used to describe some discrete results of stochastic experiments.
What if the result of a stochastic experiment cannot be described by a discrete value? For this, models that work with continuous values are used. Consider the most popular of these models.
Often we are faced with the task of checking the dependence of the results of different stochastic experiments on each other. Moreover, it is necessary not only to assess the presence of dependencies but also to somehow quantify the degree of dependencies. To solve these problems, we can use covariance and correlation.
Module 9 / Learning Statistics with Python
- Sample vs PopulationPré-visualização
- Types of StatisticsPré-visualização
- Types of DataPré-visualização
- Mean ValuePré-visualização
- Median ValuePré-visualização
- Median Value of the Even Number of ValuesPré-visualização
- Mean or MedianPré-visualização
- Mode ValuePré-visualização
- Descriptive Statistics QuizPré-visualização
This section will help us deal with the first real statistical case: finding confidence intervals. It requires knowledge of NumPy, pandas, Matplotlib, and Seaborn library to calculate math formulas and build visualization! To encourage you to pass this section, I want to point out that you will run across a small amount of theory but a significant amount of practice!
- Explore the Data SetPré-visualização
- Confidence IntervalPré-visualização
- Calculating Confidence Interval with PythonPré-visualização
- Confidence Interval Width QuizPré-visualização
- Calculate 95% Confidence IntervalPré-visualização
- Advanced Confidence Interval Calculation with PythonPré-visualização
- Match the FunctionsPré-visualização
An inseparable part of a data analyst's life is conducting hypothesis testing. After completing this section, you will understand the idea behind testing in statistics and will be able to conduct a t-test using Python.
Module 10 / Advanced Probability Theory
Now we will understand some fundamental theoretical concepts which are used in solving real live tasks: absolutely continuous and discrete random variables, probability density function, cumulative distribution function, the characteristics of a random variable, etc.
- Course OverviewPré-visualização
- Absolutely Continuous and Discrete Random VariablesPré-visualização
- Cumulative Distribution Functions and Probability Density FunctionsPré-visualização
- Characteristics of Random VariablesPré-visualização
- Random VectorsPré-visualização
- Useful Properties of the Gaussian DistributionPré-visualização
- Challenge: Detecting Outliers Using 3-Sigma RulePré-visualização
The limit theorems of probability theory are fundamental laws of probability theory that are often used in practice in a wide variety of areas, such as: building confidence intervals, estimating distribution parameters, providing A/B testings, creating ensembles of ML models, etc. Now we will consider two of the most commonly used: the Law of Large Numbers and the Central Limit Theorem.
When we work with real data we usually do not know from which distribution this data was obtained. In order to determine this, we must be able to correctly estimate the parameters of this distribution and the type of distribution, which we will learn to do in this section.
- General population. Samples. Population parameters.Pré-visualização
- Momentum estimation. Maximum Likelihood EstimationPré-visualização
- Challenge: Estimate Parameters of Chi-square DistributionPré-visualização
- Unbiased EstimationPré-visualização
- Challenge: Checking Bias of An Estimation Using SimulationPré-visualização
- Consistent EstimationPré-visualização
- Efficient EstimationPré-visualização
- Confidence Intervals for Population ParametersPré-visualização
- Challenge: Confidence Interval for Exponential Distribution ParameterPré-visualização
We have already learned how to estimate the parameters of the population. But to estimate the parameter, we make an assumption about the population distribution. Can we say that our assumption is correct? How do we prove that the estimated parameters are the real parameters of the population? Can we show that two sets of samples are independent? To answer these questions, it is necessary to consider the concept of hypothesis testing.
- What is Statistic Hypothesis? Type 1 and Type 2 ErrorsPré-visualização
- What is P-value?Pré-visualização
- Comparing Means of Two Different DatasetsPré-visualização
- Challenge: Using CLT to Compare Mean Values of Non-Gaussian DatasetsPré-visualização
- Challenge: Resampling Approach to Compare Mean Values of the DatasetsPré-visualização
- Testing the Hypothesis of Independence of Two Random VariablesPré-visualização
Requirements
- A computer with a browser - all browsers are supported.
- Your enthusiasm to enhance your tech skills.
- Everything else needed to start learning and practicing is already included in this course.
Over 200,000 5-star ratings and counting
Ruslan Kravchuk
O principal é aprender e não desistir
O material é bom, há muito a aprender, tudo para se tornar melhor e o principal é aprender o que você quer....
Matteo Comune
Graças a eles, estou aprendendo muito…
Graças a eles, estou aprendendo muito mais rápido porque eles ajudam você a entender tudo desde o início. É o melhor site que ajuda pessoas sem conhecimento em TI...
Yuliana Cadavid
óptimo curso para iniciantes
ótimo curso para iniciantes, eles testam o seu conhecimento em cada lição...
Elpunzon
Estou a gostar da minha experiência com a Codefinity…
Estou a gostar da minha experiência de aprendizagem do Python com a Codefinity. A forma de aprendizagem ao meu ritmo é óptima porque posso ajustá-la ao meu horário...
Alexandru Alexandru
É bom aprender com o Codefinity
É bom aprender com o Codefinity. É fácil e tem bons exemplos do que aprendi aqui...
jacob Templet
Easy to follow along with and provides…
É fácil seguir e proporciona desafios no meu dia-a-dia. O desafio mantém-me querendo aprender dia após dia...
Elan
A Codefinity é uma ferramenta de aprendizagem abrangente…
A Codefinity é uma ferramenta de aprendizagem abrangente que ajuda a desenvolver as suas habilidades como engenheiro de software ou cientista de dados. Os exercícios são divertidos...
Thibault
Primeira vez aprendendo a programar
Primeira vez a aprender a programar e conseguindo-o com sucesso com a Codefinity - obrigado...
Adrien Morel
Bem desenhado para iniciantes totais
Bem desenhado para iniciantes totais, progresso incremental e faz-me sentir confiante....
_Gracy
é simplesmente muito bem explicado
é simplesmente perfeitamente bem explicado! Até agora, não tive qualquer dificuldade porque tudo é muito bem gerido...
Ruslan Kravchuk
O principal é aprender e não desistir
O material é bom, há muito a aprender, tudo para se tornar melhor e o principal é aprender o que você quer....
Matteo Comune
Graças a eles, estou aprendendo muito…
Graças a eles, estou aprendendo muito mais rápido porque eles ajudam você a entender tudo desde o início. É o melhor site que ajuda pessoas sem conhecimento em TI...
Yuliana Cadavid
óptimo curso para iniciantes
ótimo curso para iniciantes, eles testam o seu conhecimento em cada lição...
Elpunzon
Estou a gostar da minha experiência com a Codefinity…
Estou a gostar da minha experiência de aprendizagem do Python com a Codefinity. A forma de aprendizagem ao meu ritmo é óptima porque posso ajustá-la ao meu horário...
Alexandru Alexandru
É bom aprender com o Codefinity
É bom aprender com o Codefinity. É fácil e tem bons exemplos do que aprendi aqui...
jacob Templet
Easy to follow along with and provides…
É fácil seguir e proporciona desafios no meu dia-a-dia. O desafio mantém-me querendo aprender dia após dia...
Elan
A Codefinity é uma ferramenta de aprendizagem abrangente…
A Codefinity é uma ferramenta de aprendizagem abrangente que ajuda a desenvolver as suas habilidades como engenheiro de software ou cientista de dados. Os exercícios são divertidos...
Thibault
Primeira vez aprendendo a programar
Primeira vez a aprender a programar e conseguindo-o com sucesso com a Codefinity - obrigado...
Adrien Morel
Bem desenhado para iniciantes totais
Bem desenhado para iniciantes totais, progresso incremental e faz-me sentir confiante....
_Gracy
é simplesmente muito bem explicado
é simplesmente perfeitamente bem explicado! Até agora, não tive qualquer dificuldade porque tudo é muito bem gerido...
Data Engineer
Certificado de Conclusão
Mostre suas habilidades recém-adquiridas. Você merece
Discover more
Learning tracks
Somente para Ultimate
7 Cursos
293 Tarefas
Somente para Ultimate
6 Cursos
168 Tarefas
Somente para Ultimate
4 Cursos
115 Tarefas
Somente para Ultimate
6 Cursos
101 Tarefas
Somente para Ultimate
4 Cursos
143 Tarefas
Somente para Ultimate
5 Cursos
119 Tarefas
Somente para Ultimate
3 Cursos
39 Tarefas
Somente para Ultimate
4 Cursos
96 Tarefas
Somente para Ultimate
7 Cursos
376 Tarefas
Somente para Ultimate
2 Cursos
1 Projeto
57 Tarefas
Somente para Ultimate
7 Cursos
346 Tarefas
Somente para Ultimate
6 Cursos
309 Tarefas
Somente para Ultimate
5 Cursos
146 Tarefas
Somente para Ultimate
5 Cursos
135 Tarefas
Somente para Ultimate
3 Cursos
71 Tarefas
Somente para Ultimate
6 Cursos
239 Tarefas
Somente para Ultimate
5 Cursos
239 Tarefas
Somente para Ultimate
4 Cursos
125 Tarefas
Somente para Ultimate
3 Cursos
119 Tarefas
Somente para Ultimate
3 Cursos
75 Tarefas
Learning tracks
trilha
Web Development with C#
Iniciante
4.8
(2345)
trilha
Python de Zero a Herói
Iniciante
4.7
(8310)
trilha
SQL do Zero ao Herói
Iniciante
4.7
(2581)
trilha
C++ para Iniciantes
Iniciante
4.5
(475)
trilha
Game Development with Unity
Iniciante
4.7
(70)
trilha
Torne-se um Desenvolvedor React
Intermediário
4.7
(66)
trilha
Excel Essentials
Iniciante
4.7
(291)
trilha
Data Analyst Foundation
Iniciante
4.8
(2483)
trilha
Essenciais de Java
Iniciante
4.7
(192)
trilha
Python: Além do Intermediário
Iniciante
4.6
(62)
trilha
Desenvolvimento Web Full Stack
Iniciante
4.7
(846)
trilha
Fundação de Desenvolvimento Frontend
Iniciante
4.7
(817)
trilha
Análise e Visualização de Dados em Python
Intermediário
4.7
(558)
trilha
Fundamentos de Aprendizado de Máquina
Intermediário
4.6
(123)
trilha
C++ Mastery
Avançado
4.8
(16)
trilha
Java Web
Avançado
4.7
(1153)
trilha
Become a QA Engineer
Iniciante
4.7
(711)
trilha
Video Production with Adobe
Iniciante
5.0
(5)
trilha
UI/UX Design Tools
Iniciante
5.0
(4)
trilha
Essential Office Skills
Iniciante
4.8
(233)
Become a Development expert
Interactive exercises
Learning videos
AI-assistant on all courses
Workspaces for designing your own projects
Ready to get started?
ProBest intro offer | UltimateA complete experience to kickstart your career | |
---|---|---|
85+ Top-Rated courses | ||
Completion certificates | ||
AI-Assistant in all courses | ||
20+ hands-on Real-world projects | ||
Personalized study tracks | ||
Unlimited workspaces | ||
Boost your Tech Skills!
with up to 55% off
What you'll get with our subscription:
Access to 85+ top-rated courses
AI-driven Learning
Workspaces for practicing your skills
Personalized study tracks
Certificates of completion
Training 2 or more people?
Get your team access to Codefinity courses anytime, anywhere.
Try Codefinity Teams