

Usikker på hvor
starte?
Track
Certifikat!
Preparation for Data Science
4.7+
★★★★★
★★★★★
1042 anmeld.
Intermediate
Track curriculum encompasses a collection of pivotal courses that provide foundational knowledge and skills essential for a successful journey in the field of data science. These courses encompass the comprehensive study of key concepts, tools, and methodologies integral to the realm of data analysis and modeling. Vis nu mere
python
Boost your Tech Skills!
with up to 55% off
What you'll get with our subscription:
Access to 85+ top-rated courses
AI-driven Learning
Workspaces for practicing your skills
Personalized study tracks
Certificates of completion
Training 2 or more people?
Get your team access to Codefinity courses anytime, anywhere.
Try Codefinity TeamsTrusted by employees of leading companies
Learning track content
Module 2 / NumPy in a Nutshell
In this section we will get acquainted with what the NumPy library is, as well as learn how to create an array.
In this section we will get acquainted with arrays of different dimensions, and understand the difference between them.
In this section we should recall what slices are and learn how to make them for arrays of different dimensions. We shall also learn to refer to elements in an array using their indexes.
- Access Array ElementsForhåndsvisning
- Match Math OperationsForhåndsvisning
- Access 2-D and 3-D ArraysForhåndsvisning
- Match the SlicingForhåndsvisning
- Negative IndexingForhåndsvisning
- Match the IndicesForhåndsvisning
- Get One Dimensional Array Using Slice and Only Positive IndexesForhåndsvisning
- Get One Dimensional Array Using Only Negative IndexesForhåndsvisning
In this section we will learn how to reshape arrays and also how to concatenate an array. Moreover we will learn how to sort an array. Also we will learn about such an interesting method that is often used for arrays, namely: copy().
Module 3 / Getting into NumPy Basics
In this project, we will delve into the fundamentals of NumPy, exploring its core features and uncovering the reasons behind its significant impact on scientific computing.
Module 4 / Pandas Første Skridt
I denne sektion vil vi udforske grundlæggende elementer i Series- og DataFrame-strukturer. Du vil også lære om forskellene mellem disse to typer strukturer.
- Hvad Er Pandas?Forhåndsvisning
- SerierForhåndsvisning
- Udfordring: Oprette en SeriesForhåndsvisning
- DataFrameForhåndsvisning
- Quiz: Oprette en SerieForhåndsvisning
- Quiz: Oprette en DataFrameForhåndsvisning
- Tilføjelse af en Ny KolonneForhåndsvisning
- Indsættelse af en Ny KolonneForhåndsvisning
- Slette en Række/KolonneForhåndsvisning
- Quiz: Matche FunktionerneForhåndsvisning
- Arbejde med KolonnerForhåndsvisning
- Quiz: Udtrækning af KolonnerForhåndsvisning
- Iloc GrundlæggendeForhåndsvisning
- Udfordring: Brug af ilocForhåndsvisning
Data kan hentes i forskellige formater, såsom CSV, JSON, SQL, HTML og mere. Med Pandas er du ikke begrænset til et enkelt format — du kan arbejde med data på tværs af en lang række filtyper. I dette kapitel vil vi specifikt fokusere på CSV- og TXT-formaterne.
Her vil du lære, hvordan man behandler rådata ved at fjerne overflødig information og håndtere null-værdier i et datasæt.
- Visning af DataForhåndsvisning
- Quiz: Brug af HeadForhåndsvisning
- Quiz: Head, Tail og SampleForhåndsvisning
- Udforske DatasættetForhåndsvisning
- Kolonnenavne og DatatyperForhåndsvisning
- Finde NullværdierForhåndsvisning
- Quiz: Identificering af Null-VærdierForhåndsvisning
- Udfordring: Fjernelse af Null-VærdierForhåndsvisning
- Udfordring: Udfyldning af Null-VærdierForhåndsvisning
- Quiz: NullværdierForhåndsvisning
- Beskriver DataeneForhåndsvisning
- Max() og Min()Forhåndsvisning
- Quiz: Statistiske OperationerForhåndsvisning
- Sum() og Count()Forhåndsvisning
- Unikke VærdierForhåndsvisning
Module 5 / Advanced Techniques in pandas
This section will teach you how to output specific columns by their titles or indices. Also, you will get acquainted with the ways you can select rows by indices.
Here, you will learn how to extract data that has specific conditions. Also, you will learn how to combine them and even create your own.
In this section, you will expand your knowledge on setting different data conditions. You will learn to check if your data is in a defined list of values or between two values. You will also learn how to find the largest and smallest values.
This section is one of the most fascinating of the course. Here, you will learn how to group data in different ways. It will help you work as a data analyst to find out information on specific data groups.
This section is one of the most significant for a data analyst because if the data contains missing data values in the incorrect format, it will be impossible to work with. Thus, you will learn how to deal with such inappropriate values here.
- Checking for Missing ValuesForhåndsvisning
- Calculating the Number of Missing ValuesForhåndsvisning
- What Will We Do With the NaN Values?Forhåndsvisning
- How to Delete Only NaN Values?Forhåndsvisning
- Filling In the Missing ValuesForhåndsvisning
- Managing Categorical VariablesForhåndsvisning
- Checking the Column TypeForhåndsvisning
- Managing an Incorrect ColumnForhåndsvisning
- Renaming the ColumnForhåndsvisning
Module 6 / Unveiling the Power of Data Manipulation with Pandas
In this project, we are going to understand what Pandas is and why it is so powerful.
Module 7 / Mathematics for Data Analysis and Modeling
Let's start with some basic definitions and concepts we'll use later. Consider the idea of a function, a numerical sequence, and its sum, and also understand what a coordinate system's basis is.
The simplest and most commonly used type of relationship is the linear relationship. Linear algebra is a branch of higher mathematics entirely devoted to linear functions and linear spaces. Let's look at some of the most important topics in linear algebra: vectors, matrices, solving linear equations, and solving the spectral problem for matrices.
- Numerical Operations on Vectors and MatricesForhåndsvisning
- Challenge: Calculate the Matrix Multiplication ResultForhåndsvisning
- Matrix DeterminantForhåndsvisning
- Scaling Factor of the Linear TransformationForhåndsvisning
- Challenge: Figures' Linear TransformationsForhåndsvisning
- Inversed and Transposed MatricesForhåndsvisning
- System of Linear EquationsForhåndsvisning
- Challenge: Solving the Task Using SLEForhåndsvisning
- Eigenvalues and EigenvectorsForhåndsvisning
Mathematical analysis is a discipline that allows you to analyze functions according to various criteria. Consider how to check numerical sequences for convergence, find the maximum/minimum values of functions, solve nonlinear equations, and use integrals to solve applied problems.
- Derivative of the FunctionForhåndsvisning
- Partial Derivative of the FunctionForhåndsvisning
- Challenge: Solving Task Using DerivativeForhåndsvisning
- Optimization ProblemForhåndsvisning
- Challenge: Solving the Optimisation ProblemForhåndsvisning
- Gradient Descent MethodForhåndsvisning
- Challenge: Optimising Function Of Multiple VariablesForhåndsvisning
Module 8 / Probability Theory Basics
We will start our way of learning probability theory by considering some basic definitions and rules: what is a stochastic experiment and random event, what is independence and incompatibility of events in the context of probability theory, what is the probability and how can we calculate probabilities of different elementary events.
- Stochastic Experiment and Random EventForhåndsvisning
- Probability and It's PropertiesForhåndsvisning
- Geometrical ProbabilityForhåndsvisning
- Challenge: Solving the Task Using Geometric ProbabilityForhåndsvisning
- Independence and Incompatibility of Random EventsForhåndsvisning
- Conditional ProbabilityForhåndsvisning
In real-life tasks, we often have to deal with complex relationships and, as a result, calculate probabilities of several events or events that depend on each other. Let's consider how we can do this using probability theory.
- Inclusion-Exclusion PrincipleForhåndsvisning
- Challenge: Solving the Task Using Inclusion-Exclusion PrincipleForhåndsvisning
- The Multiplication Rule of ProbabilityForhåndsvisning
- Law of Total ProbabilityForhåndsvisning
- Bayes' TheoremForhåndsvisning
- Challenge: Solving the Task Using Bayes' TheoremForhåndsvisning
To solve many real problems in probability theory, special models have been created that describe a particular situation. Let's consider some of the most used models that can be used to describe some discrete results of stochastic experiments.
What if the result of a stochastic experiment cannot be described by a discrete value? For this, models that work with continuous values are used. Consider the most popular of these models.
Often we are faced with the task of checking the dependence of the results of different stochastic experiments on each other. Moreover, it is necessary not only to assess the presence of dependencies but also to somehow quantify the degree of dependencies. To solve these problems, we can use covariance and correlation.
Module 9 / Lær Statistik med Python
- Stikprøve vs PopulationForhåndsvisning
- Typer af StatistikForhåndsvisning
- DatatyperForhåndsvisning
- MiddelværdiForhåndsvisning
- MedianværdiForhåndsvisning
- Medianværdi af et Lige Antal VærdierForhåndsvisning
- Gennemsnit eller MedianForhåndsvisning
- TypetalForhåndsvisning
- Quiz om Beskrivende StatistikForhåndsvisning
Dette afsnit hjælper os med at håndtere det første reelle statistiske tilfælde: at finde konfidensintervaller. Det kræver kendskab til NumPy, pandas, Matplotlib og Seaborn-biblioteket for at beregne matematiske formler og opbygge visualiseringer. For at motivere dig til at gennemføre dette afsnit vil jeg fremhæve, at du kun vil støde på en smule teori, men en betydelig mængde praksis!
- Undersøg DatasættetForhåndsvisning
- KonfidensintervalForhåndsvisning
- Beregning af Konfidensinterval med PythonForhåndsvisning
- Quiz om KonfidensintervalbreddeForhåndsvisning
- Beregn 95% KonfidensintervalForhåndsvisning
- Avanceret Beregning af Konfidensintervaller med PythonForhåndsvisning
- Match FunktionerneForhåndsvisning
En uadskillelig del af en dataanalytikers arbejde er at udføre hypoteseprøvning. Efter at have gennemført dette afsnit vil du forstå idéen bag testning i statistik og være i stand til at udføre en t-test ved hjælp af Python.
Module 10 / Advanced Probability Theory
Now we will understand some fundamental theoretical concepts which are used in solving real live tasks: absolutely continuous and discrete random variables, probability density function, cumulative distribution function, the characteristics of a random variable, etc.
- Course OverviewForhåndsvisning
- Absolutely Continuous and Discrete Random VariablesForhåndsvisning
- Cumulative Distribution Functions and Probability Density FunctionsForhåndsvisning
- Characteristics of Random VariablesForhåndsvisning
- Random VectorsForhåndsvisning
- Useful Properties of the Gaussian DistributionForhåndsvisning
- Challenge: Detecting Outliers Using 3-Sigma RuleForhåndsvisning
The limit theorems of probability theory are fundamental laws of probability theory that are often used in practice in a wide variety of areas, such as: building confidence intervals, estimating distribution parameters, providing A/B testings, creating ensembles of ML models, etc. Now we will consider two of the most commonly used: the Law of Large Numbers and the Central Limit Theorem.
When we work with real data we usually do not know from which distribution this data was obtained. In order to determine this, we must be able to correctly estimate the parameters of this distribution and the type of distribution, which we will learn to do in this section.
- General population. Samples. Population parameters.Forhåndsvisning
- Momentum estimation. Maximum Likelihood EstimationForhåndsvisning
- Challenge: Estimate Parameters of Chi-square DistributionForhåndsvisning
- Unbiased EstimationForhåndsvisning
- Challenge: Checking Bias of An Estimation Using SimulationForhåndsvisning
- Consistent EstimationForhåndsvisning
- Efficient EstimationForhåndsvisning
- Confidence Intervals for Population ParametersForhåndsvisning
- Challenge: Confidence Interval for Exponential Distribution ParameterForhåndsvisning
We have already learned how to estimate the parameters of the population. But to estimate the parameter, we make an assumption about the population distribution. Can we say that our assumption is correct? How do we prove that the estimated parameters are the real parameters of the population? Can we show that two sets of samples are independent? To answer these questions, it is necessary to consider the concept of hypothesis testing.
- What is Statistic Hypothesis? Type 1 and Type 2 ErrorsForhåndsvisning
- What is P-value?Forhåndsvisning
- Comparing Means of Two Different DatasetsForhåndsvisning
- Challenge: Using CLT to Compare Mean Values of Non-Gaussian DatasetsForhåndsvisning
- Challenge: Resampling Approach to Compare Mean Values of the DatasetsForhåndsvisning
- Testing the Hypothesis of Independence of Two Random VariablesForhåndsvisning
Requirements
- A computer with a browser - all browsers are supported.
- Your enthusiasm to enhance your tech skills.
- Everything else needed to start learning and practicing is already included in this course.
Over 200,000 5-star ratings and counting
Ruslan Kravchuk
Det vigtigste er at lære og ikke give op
Materialet er godt, der er meget at lære for at blive bedre, og det vigtigste er at lære det, du ønsker....
Matteo Comune
Takket være dem lærer jeg meget…
Takket være dem lærer jeg meget hurtigere, fordi de hjælper dig med at forstå alt fra bunden. Det er den bedste hjemmeside for folk uden IT-erfaring...
Yuliana Cadavid
fantastisk kursus for begyndere
fantastisk kursus for begyndere, som tester din viden i hver lektion...
Elpunzon
Jeg nyder min Codefinity-oplevelse…
Jeg nyder at lære Python med Codefinity. Den selvstyrede læringsmetode er fantastisk, fordi jeg kan tilpasse den min tidsplan...
Alexandru Alexandru
Det er rart at lære fra Codefinity
Det er rart at lære fra Codefinity. Det er nemt og har gode eksempler på, hvad jeg har lært her...
jacob Templet
Easy to follow along with and provides…
Let at følge med og giver daglige udfordringer. Udfordringen motiverer mig til at lære dag efter dag...
Elan
Codefinity er et omfattende læringsværktøj…
Codefinity er et omfattende læringsværktøj, der hjælper dig med at udvikle dine færdigheder som softwareingeniør eller datavidenskabsmand. Øvelserne er sjove og en god måde at finpudse dine evner på...
Thibault
Første gang jeg lærer at kode
Første gang jeg lærer at kode og lykkes med det hos Codefinity - tak...
Adrien Morel
Godt designet til totale begyndere
Godt designet til totale begyndere, med trinvis progression, der giver mig selvtillid....
_Gracy
det er simpelthen fuldstændig velforklaret
det er simpelthen fuldstændig velforklaret! Indtil videre har jeg ikke oplevet nogen problemer, fordi alt er så godt organiseret...
Ruslan Kravchuk
Det vigtigste er at lære og ikke give op
Materialet er godt, der er meget at lære for at blive bedre, og det vigtigste er at lære det, du ønsker....
Matteo Comune
Takket være dem lærer jeg meget…
Takket være dem lærer jeg meget hurtigere, fordi de hjælper dig med at forstå alt fra bunden. Det er den bedste hjemmeside for folk uden IT-erfaring...
Yuliana Cadavid
fantastisk kursus for begyndere
fantastisk kursus for begyndere, som tester din viden i hver lektion...
Elpunzon
Jeg nyder min Codefinity-oplevelse…
Jeg nyder at lære Python med Codefinity. Den selvstyrede læringsmetode er fantastisk, fordi jeg kan tilpasse den min tidsplan...
Alexandru Alexandru
Det er rart at lære fra Codefinity
Det er rart at lære fra Codefinity. Det er nemt og har gode eksempler på, hvad jeg har lært her...
jacob Templet
Easy to follow along with and provides…
Let at følge med og giver daglige udfordringer. Udfordringen motiverer mig til at lære dag efter dag...
Elan
Codefinity er et omfattende læringsværktøj…
Codefinity er et omfattende læringsværktøj, der hjælper dig med at udvikle dine færdigheder som softwareingeniør eller datavidenskabsmand. Øvelserne er sjove og en god måde at finpudse dine evner på...
Thibault
Første gang jeg lærer at kode
Første gang jeg lærer at kode og lykkes med det hos Codefinity - tak...
Adrien Morel
Godt designet til totale begyndere
Godt designet til totale begyndere, med trinvis progression, der giver mig selvtillid....
_Gracy
det er simpelthen fuldstændig velforklaret
det er simpelthen fuldstændig velforklaret! Indtil videre har jeg ikke oplevet nogen problemer, fordi alt er så godt organiseret...
Data Engineer
Certifikat for fuldførelse
Fremvis dine nyligt opnåede færdigheder. Du har fortjent det
Discover more
Learning tracks
Kun for Ultimate
7 Kurser
293 Opgaver
Kun for Ultimate
6 Kurser
196 Opgaver
Kun for Ultimate
4 Kurser
115 Opgaver
Kun for Ultimate
6 Kurser
101 Opgaver
Kun for Ultimate
4 Kurser
143 Opgaver
Kun for Ultimate
5 Kurser
119 Opgaver
Kun for Ultimate
3 Kurser
38 Opgaver
Kun for Ultimate
7 Kurser
376 Opgaver
Kun for Ultimate
2 Kurser
1 Projekt
57 Opgaver
Kun for Ultimate
7 Kurser
346 Opgaver
Kun for Ultimate
6 Kurser
309 Opgaver
Kun for Ultimate
5 Kurser
146 Opgaver
Kun for Ultimate
5 Kurser
135 Opgaver
Kun for Ultimate
3 Kurser
71 Opgaver
Kun for Ultimate
6 Kurser
239 Opgaver
Kun for Ultimate
5 Kurser
239 Opgaver
Kun for Ultimate
4 Kurser
125 Opgaver
Kun for Ultimate
3 Kurser
119 Opgaver
Kun for Ultimate
3 Kurser
75 Opgaver
Kun for Ultimate
4 Kurser
159 Opgaver
Kun for Ultimate
4 Kurser
154 Opgaver
Learning tracks
spor
Webudvikling Med C#
Begynder
4.8
(2370)
spor
Python fra Nul til Helt
Begynder
4.7
(8824)
spor
SQL fra Begynder til Ekspert
Begynder
4.7
(2604)
spor
C++ Grundlæggende
Begynder
4.4
(494)
spor
Spiludvikling med Unity
Begynder
4.7
(77)
spor
Bliv En React-Udvikler
Mellemniveau
4.7
(67)
spor
Excel Essentials
Begynder
4.7
(310)
spor
Java Essentials
Begynder
4.7
(200)
spor
Python Ud Over Mellemniveau
Begynder
4.7
(69)
spor
Full Stack Webudvikling
Begynder
4.7
(864)
spor
Frontend Udviklingsgrundlag
Begynder
4.7
(836)
spor
Mestring af Datavisualisering
Mellemniveau
4.7
(572)
spor
Superviseret Maskinlæring
Mellemniveau
4.6
(125)
spor
C++ Mastery
Avanceret
4.8
(16)
spor
Java Web
Avanceret
4.7
(1173)
spor
Bliv QA-Ingeniør
Begynder
4.7
(728)
spor
Videoproduktion med Adobe
Begynder
5.0
(5)
spor
UI/UX Designværktøjer
Begynder
4.8
(5)
spor
Essentielle Kontorfærdigheder
Begynder
4.8
(246)
spor
Digital Marketing Essentials
Begynder
5.0
(3)
spor
Complete Social Media Management
Begynder
5.0
(1)
Become a Development expert
Interactive exercises
Learning videos
AI-assistant on all courses
Workspaces for designing your own projects
Ready to get started?
ProBest intro offer | UltimateA complete experience to kickstart your career | |
---|---|---|
85+ Top-Rated courses | ||
Completion certificates | ||
AI-Assistant in all courses | ||
20+ hands-on Real-world projects | ||
Personalized study tracks | ||
Unlimited workspaces | ||
Boost your Tech Skills!
with up to 55% off
What you'll get with our subscription:
Access to 85+ top-rated courses
AI-driven Learning
Workspaces for practicing your skills
Personalized study tracks
Certificates of completion
Training 2 or more people?
Get your team access to Codefinity courses anytime, anywhere.
Try Codefinity Teams