O que é Mineração de Dados? Fundamentos e suas Técnicas.

A base da quarta revolução industrial dependerá em grande parte de Dados(Data) e Conectividade(Connectivity) . Os Analysis Services(Analysis Services) capazes de desenvolver ou criar soluções de mineração de dados desempenharão um papel fundamental nesse sentido. Pode ajudar a analisar e prever os resultados do comportamento de compra do cliente(customer purchasing behavior) para direcionar potenciais compradores. Os dados(Data) se tornarão um novo recurso natural e o processo de extração de informações relevantes desses dados não classificados assumirá imensa importância. Como tal, uma compreensão adequada do termo – (term –) Data Mining , seus processos e aplicação pode nos ajudar a desenvolver uma abordagem holística para essa palavra da moda.

Noções básicas de mineração de dados(Data Mining Basics) e suas técnicas

mineração de dados

A mineração de dados, também conhecida como Knowledge Discovery in Data ( KDD ), consiste em pesquisar grandes repositórios de dados para descobrir padrões e tendências que vão além da simples análise. Esta, no entanto, não é uma solução de etapa única, mas um processo de várias etapas e é concluído em várias etapas. Esses incluem:

1] Coleta e preparação de dados

Começa com a coleta de dados e sua organização adequada. Isso ajuda a melhorar significativamente as chances de encontrar as informações que podem ser descobertas por meio da mineração de dados

2] Construção e Avaliação do Modelo

A segunda etapa no processo de mineração(mining process) de dados é a aplicação de várias técnicas de modelagem. Estes são usados ​​para calibrar os parâmetros para valores ótimos. As técnicas empregadas dependem em grande parte das capacidades analíticas necessárias para abordar uma gama de necessidades organizacionais e para chegar a uma decisão.

Vamos examinar brevemente algumas técnicas de mineração de dados. Verifica-se que a maioria das organizações combina duas ou mais técnicas de mineração de dados para formar um processo apropriado que atenda aos seus requisitos de negócios.

Leia(Read) : O que é Big Data?

Técnicas de Mineração de Dados

  1. Associação –  A (Association – )associação(Association) é uma das técnicas de mineração de dados amplamente conhecidas. Sob isso, um padrão é decifrado com base em um relacionamento entre itens na mesma transação. Por isso(Hence) , também é conhecida como técnica de relação(relation technique) . Os varejistas de grandes marcas contam com essa técnica para pesquisar os hábitos/preferências de compra do cliente. Por exemplo, ao rastrear os hábitos de compra das pessoas, os varejistas podem identificar que um cliente sempre compra creme quando compra chocolates e, portanto, sugerir que, na próxima vez que comprar chocolates, também compre creme.
  2. Classificação(Classification) – Esta técnica de mineração de dados(data mining technique) difere da anterior na forma como é baseada em aprendizado de máquina(machine learning) e usa técnicas matemáticas como programação linear(Linear programming) , árvores de decisão , (Decision)rede neural(Neural network) . Na classificação, as empresas tentam construir um software que possa aprender a classificar os itens de dados em grupos. Por exemplo, uma empresa pode definir uma classificação no aplicativo que “dado todos os registros de funcionários que se ofereceram para se demitir da empresa, preveja o número de indivíduos que provavelmente se demitirão da empresa no futuro”. Nesse cenário, a empresa pode classificar os registros de funcionários em dois grupos que são “sair” e “ficar”. Ele pode então usar seus dadossoftware de mineração(mining software) para classificar os funcionários em grupos separados criados anteriormente.
  3. ClusteringDiferentes(Different) objetos com características semelhantes são agrupados em um único cluster via automação. Muitos desses clusters são criados à medida que classes e objetos (com características semelhantes) são colocados neles de acordo. Para entender isso melhor, vamos considerar um exemplo de gerenciamento de livros(book management) na biblioteca. Em uma biblioteca, a vasta coleção de livros é totalmente catalogada. Itens do mesmo tipo são listados juntos. Isso torna mais fácil para nós encontrar um livro de nosso interesse. Da mesma forma, usando a técnica de agrupamento(clustering technique) , podemos manter livros que possuem alguns tipos de semelhanças em um agrupamento e atribuir a ele um nome adequado. Então, se um leitor está querendo pegar um livro relevante(book relevant)para seu interesse, ele só precisa ir até aquela estante em vez de vasculhar a biblioteca inteira. Assim, a técnica de agrupamento(clustering technique) define as classes e coloca objetos em cada classe, enquanto nas técnicas de classificação, os objetos são atribuídos em classes pré-definidas.
  4. Previsão(Prediction) – A previsão é uma técnica de mineração de dados(data mining technique) que é frequentemente usada em combinação com outras técnicas de mineração de dados(data mining technique) . Envolve a análise de tendências, classificação, correspondência de padrões(pattern matching) e relação. Ao analisar eventos ou instâncias passadas em uma sequência(sequence one) adequada , pode-se prever com segurança um evento futuro. Por exemplo, a técnica de análise de previsão(prediction analysis technique) pode ser usada na venda para prever o lucro futuro se a venda for escolhida como variável independente e o lucro(variable and profit) como variável dependente da venda. Então, com base nos dados históricos de vendas e lucros , pode-se desenhar uma (sale and profit data)curva de regressão(regression curve) ajustada que é usada paraprevisão de lucro(profit prediction) .
  5. Árvores de decisão(Decision trees) – Dentro da árvore de decisão(decision tree) , começamos com uma pergunta simples que tem várias respostas. Cada resposta leva a uma pergunta adicional para ajudar a classificar ou identificar os dados para que possam ser categorizados ou para que uma previsão possa ser feita com base em cada resposta. Por exemplo, usamos a seguinte árvore de decisão(decision tree) para determinar se devemos ou não jogar críquete ODI : Data Mining Decision Tree : Começando no nó raiz(root node) , se a previsão do tempo(weather forecast) prevê chuva, devemos evitar a partida para o dia. Alternativamente, se a previsão do tempo(weather forecast) estiver clara, devemos jogar a partida.

A mineração(Data Mining) de dados está no centro dos esforços de análise em vários setores e disciplinas, como comunicações, seguros(Insurance) , educação(Education) , manufatura(Manufacturing) , bancos e varejo(Banking and Retail) e muito mais. Portanto, ter informações corretas sobre o assunto é essencial antes de aplicar as diferentes técnicas.



About the author

Sou engenheiro de hardware e desenvolvedor de software com mais de 10 anos de experiência nas plataformas Apple e Google. Minhas habilidades estão no desenvolvimento de soluções eficientes e fáceis de usar para problemas difíceis de engenharia. Eu tive experiência com dispositivos MacOS e iOS, bem como com controles de teclado e mouse. Nas horas vagas, gosto de nadar, assistir tênis e ouvir música.



Related posts