O Que É Classificação
Classificação é uma tarefa de aprendizado supervisionado. Seu objetivo é prever a classe à qual a instância pertence com base em um conjunto de parâmetros (características). É necessário fornecer muitos exemplos rotulados de dados (chamados de conjunto de treinamento) para que o computador aprenda antes de conseguir prever a classe de uma nova instância.
A diferença entre classificação e regressão é que a regressão prevê um valor numérico contínuo, por exemplo, um preço. Pode ser qualquer número real (apenas positivo para um preço).
Em contraste, a classificação prevê um valor categórico, por exemplo, o tipo de doce. Existe um conjunto finito de valores, e o modelo tenta classificar cada instância em uma dessas categorias.
Com base na formulação de um problema, existem vários tipos de classificação:
-
Classificação binária: na classificação binária, o alvo é um de dois possíveis resultados. Por exemplo, e-mail: spam/não spam, doce: cookie/não cookie;
-
Classificação multiclasse: na classificação multiclasse, existem três ou mais possíveis resultados para um alvo. Por exemplo, e-mail: spam/importante/anúncio/outro, doce: cookie/marshmallow/bala;
-
Classificação multilabel: na classificação multilabel, cada instância pode pertencer a múltiplas classes ao mesmo tempo. Por exemplo, um filme pode ser classificado como ação e comédia, ou um e-mail pode ser marcado como importante e relacionado ao trabalho.
Para a maioria dos modelos de ML, é necessário codificar o alvo como um número. Para classificação binária, os resultados geralmente são codificados como 0/1 (por exemplo, 1 - cookie, 0 - não cookie). Para classificação multiclasse, os resultados geralmente são codificados como 0, 1, 2, ... (por exemplo, 0 - candy, 1 - cookie, 2 - marshmallow).
Diversos modelos diferentes podem realizar classificação. Alguns exemplos incluem:
- k-Nearest Neighbors;
- Regressão Logística;
- Árvore de Decisão;
- Random Forest.
Felizmente, todos estão implementados na biblioteca scikit-learn e são fáceis de usar.
Nenhum modelo de aprendizado de máquina é superior a outro. O desempenho de cada modelo depende da tarefa específica.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 4.17
O Que É Classificação
Deslize para mostrar o menu
Classificação é uma tarefa de aprendizado supervisionado. Seu objetivo é prever a classe à qual a instância pertence com base em um conjunto de parâmetros (características). É necessário fornecer muitos exemplos rotulados de dados (chamados de conjunto de treinamento) para que o computador aprenda antes de conseguir prever a classe de uma nova instância.
A diferença entre classificação e regressão é que a regressão prevê um valor numérico contínuo, por exemplo, um preço. Pode ser qualquer número real (apenas positivo para um preço).
Em contraste, a classificação prevê um valor categórico, por exemplo, o tipo de doce. Existe um conjunto finito de valores, e o modelo tenta classificar cada instância em uma dessas categorias.
Com base na formulação de um problema, existem vários tipos de classificação:
-
Classificação binária: na classificação binária, o alvo é um de dois possíveis resultados. Por exemplo, e-mail: spam/não spam, doce: cookie/não cookie;
-
Classificação multiclasse: na classificação multiclasse, existem três ou mais possíveis resultados para um alvo. Por exemplo, e-mail: spam/importante/anúncio/outro, doce: cookie/marshmallow/bala;
-
Classificação multilabel: na classificação multilabel, cada instância pode pertencer a múltiplas classes ao mesmo tempo. Por exemplo, um filme pode ser classificado como ação e comédia, ou um e-mail pode ser marcado como importante e relacionado ao trabalho.
Para a maioria dos modelos de ML, é necessário codificar o alvo como um número. Para classificação binária, os resultados geralmente são codificados como 0/1 (por exemplo, 1 - cookie, 0 - não cookie). Para classificação multiclasse, os resultados geralmente são codificados como 0, 1, 2, ... (por exemplo, 0 - candy, 1 - cookie, 2 - marshmallow).
Diversos modelos diferentes podem realizar classificação. Alguns exemplos incluem:
- k-Nearest Neighbors;
- Regressão Logística;
- Árvore de Decisão;
- Random Forest.
Felizmente, todos estão implementados na biblioteca scikit-learn e são fáceis de usar.
Nenhum modelo de aprendizado de máquina é superior a outro. O desempenho de cada modelo depende da tarefa específica.
Obrigado pelo seu feedback!