Powered By Blogger

sexta-feira, 20 de novembro de 2009

Data Mining




Slide 4


O que é Data mining:
“Data mining (mineração de dados), é o processo de extração de conhecimento de grandes bases de dados, convencionais ou não.
Utiliza técnicas de inteligência artificial que procuram relações de similaridade ou discordância entre dados.
Seu objetivo é encontrar, automaticamente, padrões, anomalias e regras com o propósito de transformar dados, aparentemente ocultos, em informações úteis para a tomada de decisão e/ou avaliação de resultados.
Uma empresa utilizando data mining é capaz de:
Criar parâmetros para entender o comportamento do consumidor;
Identificar afinidades entre as escolhas de produtos e serviços;
Prever hábitos de compras;
Analisar comportamentos habituais para detectar fraudes.


Data mining X Data warehouse:
Data mining  extração inteligente de dados;
Data warehouse   repositório centralizado de dados;
Data mining não é uma evolução do Data warehouse;
Data mining não depende do Data warehouse, mas obtém-se melhores resultados quando aplicados em conjunto;
Cada empresa deve saber escolher qual das técnicas é importante para o seu negócio. (Uma, outra ou as duas);
Data Warehouse aliado a ferramentas estatísticas desempenham papel semelhante ao data mining, mas não descobrem novos padrões de comportamento. (a não ser empiricamente).




Funções do data mining
Modelo de classificação :
Atributos + significativos def. um classe
O usuário define as atributos para cada classe (A.S.)
Aplica regras para criar modelos de ações futuras
Ex: Clientes com bom crédito ñ podem dever mais 10%


Associação:
Procura registos que tenham similaridades associativas
Podem ser expressados por regras
Ex: 62% dos compradores de guaraná compram pipoca
62% fator de confiança
LHS (left hand side)
RHS (right hand side)


Padrões temporais/seqüenciais :
Analisa registros num período de tempo, procurando encontrar padrões (eventos/compras) de comportamento.
Identificar o perfil do cliente
Identificar padrões que precedem outros padrões
Ex: Mala direta personalizada, Campanhas promocionais ..


Segmentação/agrupamento:
Segmenta a base de dados em grupos por suas similaridade e diferenças
O sistema tem que descobrir por si próprio as similaridade e diferenças ( A.Ñ.S.)
Ex: Clientes de bom crédito e clientes de mau crédito
         Fases / Etapas.
        Seleção.
        Pré-processamento.
        Transformação.
        Data mining.
        Interpretação e Avaliação.
         Seleção
        Selecionar ou segmentar dados de acordo com critérios definidos:
        Ex.: Todas as pessoas que são proprietárias de carros é um subconjunto de dados determinado.


         Pré-processamento
        Estágio de limpeza dos dados, onde informações julgadas desnecessárias são removidas.
        Ex. :O sexo de um paciente gestante
        Reconfiguração dos dados para assegurar formatos consistentes (identificação)
        Ex. : sexo = “F”  ou “M”
                             sexo = “M” ou  “H” 
         Transformação
         Transforma-se os dados em formatos utilizáveis. Esta depende da técnica data mining usada.
         Ex: rede neural Þ converter valor literal em valor numérico
         Disponibilizar os dados de maneira usável e navegável.


          Data mining
         É a verdadeira extração dos padrões de comportamento dos dados
         Utilizando a definição de fatos, medidas de padrões, estados e o relacionamento entre eles.
         Interpretação e Avaliação
         Identificado os padrões pelo sistema, estes são interpretados em conhecimentos, os quais darão suporte a tomada de decisões humanas
         Ex.: Tarefas de previsões e classificações

Nenhum comentário:

Postar um comentário