

Epävarma mistä
alkaa?
Track
Todistus
Preparation for Data Science
4.7+
★★★★★
★★★★★
1042 arvostelut
Intermediate
Track curriculum encompasses a collection of pivotal courses that provide foundational knowledge and skills essential for a successful journey in the field of data science. These courses encompass the comprehensive study of key concepts, tools, and methodologies integral to the realm of data analysis and modeling. Näytä lisää
python
Boost your Tech Skills!
with up to 55% off
What you'll get with our subscription:
Access to 85+ top-rated courses
AI-driven Learning
Workspaces for practicing your skills
Personalized study tracks
Certificates of completion
Training 2 or more people?
Get your team access to Codefinity courses anytime, anywhere.
Try Codefinity TeamsTrusted by employees of leading companies
Learning track content
Module 2 / NumPy in a Nutshell
In this section we will get acquainted with what the NumPy library is, as well as learn how to create an array.
In this section we will get acquainted with arrays of different dimensions, and understand the difference between them.
In this section we should recall what slices are and learn how to make them for arrays of different dimensions. We shall also learn to refer to elements in an array using their indexes.
- Access Array ElementsEsikatselu
- Match Math OperationsEsikatselu
- Access 2-D and 3-D ArraysEsikatselu
- Match the SlicingEsikatselu
- Negative IndexingEsikatselu
- Match the IndicesEsikatselu
- Get One Dimensional Array Using Slice and Only Positive IndexesEsikatselu
- Get One Dimensional Array Using Only Negative IndexesEsikatselu
In this section we will learn how to reshape arrays and also how to concatenate an array. Moreover we will learn how to sort an array. Also we will learn about such an interesting method that is often used for arrays, namely: copy().
Module 3 / Getting into NumPy Basics
In this project, we will delve into the fundamentals of NumPy, exploring its core features and uncovering the reasons behind its significant impact on scientific computing.
Module 4 / Pandas Ensimmäiset Askeleet
Tässä osiossa tutustumme Series- ja DataFrame-rakenteiden perusteisiin. Opit myös näiden kahden rakenteen välisistä eroista.
- Mikä On Pandas?Esikatselu
- SarjatEsikatselu
- Haaste: Sarjan LuominenEsikatselu
- DatarunkoEsikatselu
- Visailu: Sarjan LuominenEsikatselu
- Visailu: DataFrame LuominenEsikatselu
- Uuden Sarakkeen LisääminenEsikatselu
- Uuden Sarakkeen LisääminenEsikatselu
- Rivin/Sarakkeen PoistaminenEsikatselu
- Visailu: Toimintojen YhdistäminenEsikatselu
- Työskentely Sarakkeiden KanssaEsikatselu
- Visailu: Sarakkeiden PoimiminenEsikatselu
- Iloc PerusteetEsikatselu
- Haaste: iloc:n KäyttäminenEsikatselu
Dataa voi olla saatavilla eri muodoissa, kuten CSV, JSON, SQL, HTML ja monia muita. Pandasin avulla et ole rajoittunut yhteen muotoon — voit työskennellä datan kanssa monissa eri tiedostotyypeissä. Tässä luvussa keskitymme erityisesti CSV- ja TXT-muotoihin.
Tässä opit käsittelemään raakadataa poistamalla ylimääräistä tietoa ja hallitsemalla puuttuvia arvoja tietojoukossa.
- Datan TarkasteluEsikatselu
- Visailu: Head-Funktion KäyttöEsikatselu
- Visailu: Head, Tail ja SampleEsikatselu
- Tutkitaan TietojoukkoaEsikatselu
- Sarakkeiden Nimet ja TietotyypitEsikatselu
- Null-Arvojen LöytäminenEsikatselu
- Visailu: Null-Arvojen TunnistaminenEsikatselu
- Haaste: Null-Arvojen PoistaminenEsikatselu
- Haaste: Täyttää Null-ArvotEsikatselu
- Visailu: Null-ArvotEsikatselu
- Kuvaillaan TietojaEsikatselu
- Max() ja Min()Esikatselu
- Visailu: Tilastolliset ToiminnotEsikatselu
- Sum() ja Count()Esikatselu
- Ainutlaatuiset ArvotEsikatselu
Module 5 / Advanced Techniques in pandas
This section will teach you how to output specific columns by their titles or indices. Also, you will get acquainted with the ways you can select rows by indices.
Here, you will learn how to extract data that has specific conditions. Also, you will learn how to combine them and even create your own.
In this section, you will expand your knowledge on setting different data conditions. You will learn to check if your data is in a defined list of values or between two values. You will also learn how to find the largest and smallest values.
This section is one of the most fascinating of the course. Here, you will learn how to group data in different ways. It will help you work as a data analyst to find out information on specific data groups.
This section is one of the most significant for a data analyst because if the data contains missing data values in the incorrect format, it will be impossible to work with. Thus, you will learn how to deal with such inappropriate values here.
- Checking for Missing ValuesEsikatselu
- Calculating the Number of Missing ValuesEsikatselu
- What Will We Do With the NaN Values?Esikatselu
- How to Delete Only NaN Values?Esikatselu
- Filling In the Missing ValuesEsikatselu
- Managing Categorical VariablesEsikatselu
- Checking the Column TypeEsikatselu
- Managing an Incorrect ColumnEsikatselu
- Renaming the ColumnEsikatselu
Module 6 / Unveiling the Power of Data Manipulation with Pandas
In this project, we are going to understand what Pandas is and why it is so powerful.
Module 7 / Mathematics for Data Analysis and Modeling
Let's start with some basic definitions and concepts we'll use later. Consider the idea of a function, a numerical sequence, and its sum, and also understand what a coordinate system's basis is.
The simplest and most commonly used type of relationship is the linear relationship. Linear algebra is a branch of higher mathematics entirely devoted to linear functions and linear spaces. Let's look at some of the most important topics in linear algebra: vectors, matrices, solving linear equations, and solving the spectral problem for matrices.
- Numerical Operations on Vectors and MatricesEsikatselu
- Challenge: Calculate the Matrix Multiplication ResultEsikatselu
- Matrix DeterminantEsikatselu
- Scaling Factor of the Linear TransformationEsikatselu
- Challenge: Figures' Linear TransformationsEsikatselu
- Inversed and Transposed MatricesEsikatselu
- System of Linear EquationsEsikatselu
- Challenge: Solving the Task Using SLEEsikatselu
- Eigenvalues and EigenvectorsEsikatselu
Mathematical analysis is a discipline that allows you to analyze functions according to various criteria. Consider how to check numerical sequences for convergence, find the maximum/minimum values of functions, solve nonlinear equations, and use integrals to solve applied problems.
- Derivative of the FunctionEsikatselu
- Partial Derivative of the FunctionEsikatselu
- Challenge: Solving Task Using DerivativeEsikatselu
- Optimization ProblemEsikatselu
- Challenge: Solving the Optimisation ProblemEsikatselu
- Gradient Descent MethodEsikatselu
- Challenge: Optimising Function Of Multiple VariablesEsikatselu
Module 8 / Probability Theory Basics
We will start our way of learning probability theory by considering some basic definitions and rules: what is a stochastic experiment and random event, what is independence and incompatibility of events in the context of probability theory, what is the probability and how can we calculate probabilities of different elementary events.
In real-life tasks, we often have to deal with complex relationships and, as a result, calculate probabilities of several events or events that depend on each other. Let's consider how we can do this using probability theory.
To solve many real problems in probability theory, special models have been created that describe a particular situation. Let's consider some of the most used models that can be used to describe some discrete results of stochastic experiments.
What if the result of a stochastic experiment cannot be described by a discrete value? For this, models that work with continuous values are used. Consider the most popular of these models.
Often we are faced with the task of checking the dependence of the results of different stochastic experiments on each other. Moreover, it is necessary not only to assess the presence of dependencies but also to somehow quantify the degree of dependencies. To solve these problems, we can use covariance and correlation.
Tässä osiossa käsitellään ensimmäistä todellista tilastollista tapausta: luottamusvälien määrittämistä. Se edellyttää NumPy-, pandas-, Matplotlib- ja Seaborn-kirjastojen tuntemusta matemaattisten kaavojen laskemiseen ja visualisointien rakentamiseen. Kannustuksena tämän osion suorittamiseen mainittakoon, että teoriaa on vain vähän, mutta käytännön harjoituksia runsaasti!
Hypoteesin testaaminen on olennainen osa data-analyytikon työtä. Tämän osion jälkeen ymmärrät tilastollisen testaamisen perusidean ja osaat suorittaa t-testin Pythonilla.
Module 10 / Advanced Probability Theory
Now we will understand some fundamental theoretical concepts which are used in solving real live tasks: absolutely continuous and discrete random variables, probability density function, cumulative distribution function, the characteristics of a random variable, etc.
- Course OverviewEsikatselu
- Absolutely Continuous and Discrete Random VariablesEsikatselu
- Cumulative Distribution Functions and Probability Density FunctionsEsikatselu
- Characteristics of Random VariablesEsikatselu
- Random VectorsEsikatselu
- Useful Properties of the Gaussian DistributionEsikatselu
- Challenge: Detecting Outliers Using 3-Sigma RuleEsikatselu
The limit theorems of probability theory are fundamental laws of probability theory that are often used in practice in a wide variety of areas, such as: building confidence intervals, estimating distribution parameters, providing A/B testings, creating ensembles of ML models, etc. Now we will consider two of the most commonly used: the Law of Large Numbers and the Central Limit Theorem.
When we work with real data we usually do not know from which distribution this data was obtained. In order to determine this, we must be able to correctly estimate the parameters of this distribution and the type of distribution, which we will learn to do in this section.
- General population. Samples. Population parameters.Esikatselu
- Momentum estimation. Maximum Likelihood EstimationEsikatselu
- Challenge: Estimate Parameters of Chi-square DistributionEsikatselu
- Unbiased EstimationEsikatselu
- Challenge: Checking Bias of An Estimation Using SimulationEsikatselu
- Consistent EstimationEsikatselu
- Efficient EstimationEsikatselu
- Confidence Intervals for Population ParametersEsikatselu
- Challenge: Confidence Interval for Exponential Distribution ParameterEsikatselu
We have already learned how to estimate the parameters of the population. But to estimate the parameter, we make an assumption about the population distribution. Can we say that our assumption is correct? How do we prove that the estimated parameters are the real parameters of the population? Can we show that two sets of samples are independent? To answer these questions, it is necessary to consider the concept of hypothesis testing.
- What is Statistic Hypothesis? Type 1 and Type 2 ErrorsEsikatselu
- What is P-value?Esikatselu
- Comparing Means of Two Different DatasetsEsikatselu
- Challenge: Using CLT to Compare Mean Values of Non-Gaussian DatasetsEsikatselu
- Challenge: Resampling Approach to Compare Mean Values of the DatasetsEsikatselu
- Testing the Hypothesis of Independence of Two Random VariablesEsikatselu
Requirements
- A computer with a browser - all browsers are supported.
- Your enthusiasm to enhance your tech skills.
- Everything else needed to start learning and practicing is already included in this course.
Over 200,000 5-star ratings and counting
Ruslan Kravchuk
Tärkeintä on oppia eikä luovuttaa
Materiaali on hyvä, opittavaa riittää – kaikki parantuaksesi ja tärkeintä on oppia sitä, mitä haluat....
Matteo Comune
Kiitos heille opin paljon…
Kiitos heille opin paljon nopeammin, koska he auttavat ymmärtämään kaiken alusta alkaen. Tämä on paras sivusto, joka tukee IT-taustattomia...
Yuliana Cadavid
Loistava kurssi aloittelijoille
Loistava kurssi aloittelijoille, joka testaa tietosi jokaisella oppitunnilla...
Elpunzon
Nautin Codefinity-kokemuksestani…
Nautin Codefinity-kokemuksesta Pythonin oppimiseen. Itseohjautuva oppimismenetelmä on erinomainen, sillä se mahtuu aikatauluuni...
Alexandru Alexandru
On mukava oppia Codefinityltä
On mukava oppia Codefinityltä. Se on helppoa ja tarjoaa hyviä esimerkkejä opitusta...
jacob Templet
Easy to follow along with and provides…
Helppo seurata ja se tuo haastetta arkeeni. Haaste saa minut haluamaan oppia päivä toisensa jälkeen...
Elan
Codefinity on kattava oppimisväline…
Codefinity on kattava oppimisväline, joka auttaa kehittämään taitojasi ohjelmistoinsinöörinä tai datatieteilijänä. Harjoitukset ovat hauskoja ja erinomainen tapa hioa taitojasi...
Thibault
Ensimmäistä kertaa koodaamista opiskellen
Ensimmäistä kertaa koodaamista opiskellen ja onnistuneesti Codefinityn avulla – kiitos...
Adrien Morel
Hyvin suunniteltu täysin aloittelijoille
Hyvin suunniteltu täysin aloittelijoille, sisältää asteittaista edistystä ja saa minut tuntemaan oloni varmaksi....
_Gracy
se on yksinkertaisesti täydellisesti selitetty
se on yksinkertaisesti täydellisesti selitetty! Tähän mennessä en ole kohdannut vaikeuksia, koska kaikki on niin hyvin järjestetty....
Ruslan Kravchuk
Tärkeintä on oppia eikä luovuttaa
Materiaali on hyvä, opittavaa riittää – kaikki parantuaksesi ja tärkeintä on oppia sitä, mitä haluat....
Matteo Comune
Kiitos heille opin paljon…
Kiitos heille opin paljon nopeammin, koska he auttavat ymmärtämään kaiken alusta alkaen. Tämä on paras sivusto, joka tukee IT-taustattomia...
Yuliana Cadavid
Loistava kurssi aloittelijoille
Loistava kurssi aloittelijoille, joka testaa tietosi jokaisella oppitunnilla...
Elpunzon
Nautin Codefinity-kokemuksestani…
Nautin Codefinity-kokemuksesta Pythonin oppimiseen. Itseohjautuva oppimismenetelmä on erinomainen, sillä se mahtuu aikatauluuni...
Alexandru Alexandru
On mukava oppia Codefinityltä
On mukava oppia Codefinityltä. Se on helppoa ja tarjoaa hyviä esimerkkejä opitusta...
jacob Templet
Easy to follow along with and provides…
Helppo seurata ja se tuo haastetta arkeeni. Haaste saa minut haluamaan oppia päivä toisensa jälkeen...
Elan
Codefinity on kattava oppimisväline…
Codefinity on kattava oppimisväline, joka auttaa kehittämään taitojasi ohjelmistoinsinöörinä tai datatieteilijänä. Harjoitukset ovat hauskoja ja erinomainen tapa hioa taitojasi...
Thibault
Ensimmäistä kertaa koodaamista opiskellen
Ensimmäistä kertaa koodaamista opiskellen ja onnistuneesti Codefinityn avulla – kiitos...
Adrien Morel
Hyvin suunniteltu täysin aloittelijoille
Hyvin suunniteltu täysin aloittelijoille, sisältää asteittaista edistystä ja saa minut tuntemaan oloni varmaksi....
_Gracy
se on yksinkertaisesti täydellisesti selitetty
se on yksinkertaisesti täydellisesti selitetty! Tähän mennessä en ole kohdannut vaikeuksia, koska kaikki on niin hyvin järjestetty....
Data Engineer
Suoritustodistus
Näytä äskettäin hankitut taitosi. Olet ansainnut sen
Discover more
Learning tracks
Vain Ultimate
7 Kurssit
293 Tehtävät
Vain Ultimate
6 Kurssit
196 Tehtävät
Vain Ultimate
4 Kurssit
115 Tehtävät
Vain Ultimate
6 Kurssit
101 Tehtävät
Vain Ultimate
4 Kurssit
143 Tehtävät
Vain Ultimate
5 Kurssit
119 Tehtävät
Vain Ultimate
3 Kurssit
38 Tehtävät
Vain Ultimate
7 Kurssit
376 Tehtävät
Vain Ultimate
2 Kurssit
1 Projekti
57 Tehtävät
Vain Ultimate
7 Kurssit
346 Tehtävät
Vain Ultimate
6 Kurssit
309 Tehtävät
Vain Ultimate
5 Kurssit
146 Tehtävät
Vain Ultimate
5 Kurssit
135 Tehtävät
Vain Ultimate
3 Kurssit
71 Tehtävät
Vain Ultimate
6 Kurssit
239 Tehtävät
Vain Ultimate
5 Kurssit
239 Tehtävät
Vain Ultimate
4 Kurssit
125 Tehtävät
Vain Ultimate
3 Kurssit
119 Tehtävät
Vain Ultimate
3 Kurssit
75 Tehtävät
Vain Ultimate
4 Kurssit
159 Tehtävät
Vain Ultimate
4 Kurssit
154 Tehtävät
Learning tracks
polku
Verkkokehitys C#:lla
Aloittelija
4.8
(2370)
polku
Python Nollasta Sankariksi
Aloittelija
4.7
(8824)
polku
SQL Alkeista Asiantuntijaksi
Aloittelija
4.7
(2604)
polku
C++ Perusteet
Aloittelija
4.4
(494)
polku
Pelinkehitys Unitylla
Aloittelija
4.7
(77)
polku
Tule React Developeriksi
Keskitaso
4.7
(67)
polku
Excelin Perusteet
Aloittelija
4.7
(310)
polku
Java Perusteet
Aloittelija
4.7
(200)
polku
Python Edistyneen Tason Yli
Aloittelija
4.7
(69)
polku
Full Stack -Verkkokehitys
Aloittelija
4.7
(864)
polku
Frontend-Kehityksen Perusteet
Aloittelija
4.7
(836)
polku
Datan Visualisoinnin Hallinta
Keskitaso
4.7
(572)
polku
Supervised Machine Learning
Keskitaso
4.6
(125)
polku
C++ Osaaminen
Edistynyt
4.8
(16)
polku
Java Web
Edistynyt
4.7
(1173)
polku
Tule QA-Insinööriksi
Aloittelija
4.7
(728)
polku
Video Production with Adobe
Aloittelija
5.0
(5)
polku
UI/UX-Suunnittelutyökalut
Aloittelija
4.8
(5)
polku
Olennaiset Toimistotaidot
Aloittelija
4.8
(246)
polku
Digital Marketing Essentials
Aloittelija
5.0
(3)
polku
Complete Social Media Management
Aloittelija
5.0
(1)
Become a Development expert
Interactive exercises
Learning videos
AI-assistant on all courses
Workspaces for designing your own projects
Ready to get started?
ProBest intro offer | UltimateA complete experience to kickstart your career | |
---|---|---|
85+ Top-Rated courses | ||
Completion certificates | ||
AI-Assistant in all courses | ||
20+ hands-on Real-world projects | ||
Personalized study tracks | ||
Unlimited workspaces | ||
Boost your Tech Skills!
with up to 55% off
What you'll get with our subscription:
Access to 85+ top-rated courses
AI-driven Learning
Workspaces for practicing your skills
Personalized study tracks
Certificates of completion
Training 2 or more people?
Get your team access to Codefinity courses anytime, anywhere.
Try Codefinity Teams