sexta-feira, 6 de fevereiro de 2015

Slides para apresentação final

domingo, 1 de fevereiro de 2015

Sistemas transacionais x Sistemas de apoio à decisão

Um Sistema de Apoio à Decisão (SAD) tem características completamente distintas de um sistema transacional, pois utiliza “inteligência” para efetuar suas transações, como prover informações para se definir uma campanha demarketing, elaborar as táticas futuras para o lançamento de novos produtos, descobrir qual a melhor estratégia para se aumentar as vendas de um dado produto, etc. Um SAD geralmente utiliza como repositório de dados um DW – Data Warehouse, que está desvinculado das bases de dados que dão sustentação aos sistemas transacionais, também chamadas de OLTP – OnLine Transaction Processing. Novamente para ficar mais claro, voltemos ao caso da instituição bancária.

 


Um exemplo de SAD poderia ser conhecer os potenciais clientes para se realizar uma campanha de financiamento de veículos. Neste caso, o banco poderia considerar como  potenciais clientes, somente aqueles que já sejam proprietários de veículos, que realizaram algum tipo de financiamento com o banco nos últimos 5 anos, cujo saldo médio nos últimos 12 meses seja superior a R$5000.00 e com a restrição de  que sua idade acrescida do prazo de financiamento não superar 75 anos. Para se chegar à lista de clientes potenciais para esta campanha, seria necessário consultar as informações que estão no Data Warehouse e não na base de dados dos sistemas transacionais. Ainda segundo Terribili (2009), em função das particularidades do tipo de processamento e de transação, o ambiente dos sistemas de BI deve ser dissociado do ambiente transacional, uma vez que no BI as pesquisas são mais complexas e há um volume muito maior de informações, das quais os dados históricos são de grande importância.  Assim o tempo de resposta de uma transação de BI pode ser muito mais lento do que o de uma operação transacional. Um exemplo interessante de BI é o utilizado pela rede de supermercados Pão de Açúcar. Em sua estratégia, o cliente da rede, quando efetua suas compras, recebe determinada pontuação como “Cliente Mais” que lhe dá algumas facilidades e benefícios futuros, porém, o mais importante para o BI é que o sistema registre o seu histórico de consumo no DW.

Fonte: http://www.diegomacedo.com.br/data-warehouse/

Quais são as estratégias de implementação de um data warehouse?

A implementação de um data warehouse depende de ações políticas e técnicas. No campo político, assegure-se que exista suporte da alta direção da empresa e o comprometimento dos gerentes e analistas de negócios da área alvo de implementação. 

Escolha uma área que os resultados possam ser obtidos rapidamente. No campo técnico existem três abordagens de implementação: data warehouse virtual,data mart e data warehouse central. Comece implantando um data warehouse virtual para medir os benefícios dessa tecnologia na empresa e obter mais apoio interno. Selecione os dados a serem utilizados no data warehouse, pois os usuários se frustram com relatórios que sabem que estão incorretos. Recrute consultores experientes, interna e externamente.

Um data warehouse deve vir ao encontro de uma necessidade de negócio da empresa. A área de negócio deve ser a patrocinadora da iniciativa. Muitos projetos iniciados pelas áreas de sistemas fracassaram por não terem o apoio político necessário da direção da empresa ou por não terem definido um caso de negócio concreto. Escolha um projeto onde o retorno do investimento seja rápido e de fácil implementação. Evite escolher projetos complexos pois os resultados podem não ser tangíveis a curto prazo. Em projetos complexos o custo e o esforço de implementação são altos, correndo o risco de serem abortados antes dos benefícios aparecerem.

Na área técnica existem três abordagens de implementação de data warehouses: os virtuais, os data marts e os centrais. O data warehouse virtual utiliza o conceito de metadados (dados sobre dados) com regras de negócios. A partir dos metadados são acessados os dados diretamente das bases operacionais, tornando os custos mais baixos e reduzindo o tempo de implementação. Além de serem mais fáceis de implementar é possível demonstrar a viabilidade do projeto. Os data marts são data warehouses distribuídos e dedicados à áreas de negócios específicas. A vantagem é segregar em um ambiente todos os dados relativos a um determinado negócio e utilizar ferramentas analíticas orientadas para o negócio alvo. Os data warehouses centrais contém dados suficientes para descrever o negócio como um todo. Sua implementação é complexa e cara, porém permitindo uma visão global dos dados e pesquisas analíticas mais amplas.



Desenvolve-se data marts a medida das necessidades de negócios e através de metadados padrões obtém-se a visão dos dados distribuídos, ampliando o processo de pesquisa analítica. Também os metadados tem a capacidade de acessar dados operacionais em diversos tipos de bancos de dados, ideal para ambientes que requerem uma baixa extração e transformação dos dados. A utilização de metadados facilita a transição de data marts baseados em bancos de dados de baixo custo para ambientes corporativos mais complexos e na migração para o data warehouse central.

No mercado existem várias ferramentas de pesquisa analítica de dados para data warehouse que podem ser utilizadas em diferentes bancos de dados, incluindo os bancos de dados relacionais e multidimensionais ideais para requisitos complexos de apoio à decisão.

Fonte: http://www.efagundes.com/artigos/Quais%20as%20estrategias%20de%20implementacao%20de%20um%20data%20warehouse.htm

Quais informações devem ser armazenadas no data warehouse?

As empresas investem em tecnologias de data warehouse para melhorar seus processos decisórios e gerenciais, melhorar seus serviços a clientes, aumentar sua competitividade perante a concorrência, reduzir seus custos operacionais, manter e identificar novos clientes. Para garantir a confiabilidade das análises, o processo de migração das bases de dados operacionais para o data warehouse é uma das fases mais críticas o projeto. Evita-se na fase de migração e limpeza dos dados o fenômeno "garbage in, garbage out", ou seja, se os dados de entrada são ruins o resultado das análises será igualmente ruim. Recomenda-se cinco etapas para a migração dos dados desde a extração dos dados nas bases de origem até a validação dos dados. Não negligencie a fase inicial de migração dos dados, pois os usuários reconhecem imediatamente as análises ruins e isso decretará o fracasso do projeto.


Para atingir os objetivos das empresas de melhorias internas de seus processos com a introdução dos data warehouses os analistas envolvidos no projeto deve assegurar a qualidade dos dados migrados das bases operacionais. Dados iguais podem estar representados de diversas formas nas bases de dados. Por exemplo, o código para identificar o sexo da pessoa pode estar representado por "1" e "2" em uma base em outra por "M" e "F". No processo de migração e limpeza dos dados essas divergências devem ser corrigidas. Observe os seguintes passos no processo de limpeza dos dados:
  • O exame dos dados determina sua qualidade, verificando os padrões de representação de dados adotados e o número de campos utilizados;
  • A análise dos dados determina o contexto e destino de cada campo;
  • A correção de dados para garantir que os dados sejam assinalados com bons, ruins ou que os dados possam ser automaticamente corrigidos; e,
  • A coincidência de registros determina se dois registros podem ou não representar o mesmo objeto, exigindo muitos julgamentos dos analistas e ferramentas sofisticadas.
O ciclo completo de migração de dados das bases operacionais para os bancos de dados do data warehouse exige cinco etapas:
  1. Extração dos dados do sistema de origem para um ambiente intermediário, conhecido com staging area. As rotinas de extração servem para selecionar os dados do sistema de origem para o data warehouse. Normalmente, essas rotinas são executadas no ambiente de origem dos dados para facilitar a execução de rotinas que transformam, convertem, combinam e analisam os dados de origem.
  2. Conversão dos esquemas da staging area para carregar os dados. Nessa etapa é realizada a limpeza dos dados para garantir a integridade da informação. Um cuidado especial deve ser dado as chaves de pesquisas utilizadas nos bancos de dados de origem e as chaves que serão utilizadas no banco de dados de destino.
  3. Consolidação dos dados da staging area em tabelas que refletem o contexto de negócio. Os dados agregados refletem os dados definidos pelo projeto após passarem por vários processos de classificação e definida qual a melhor chave de pesquisa para o data warehouse.
  4. Migração dos dados da staging area para o banco de dados do data warehouse. Recomenda-se nessa etapa o uso do software de carregamento do próprio banco de dados de destino, utilizando a integridade referencial para garantir que as chaves das tabelas estejam íntegras.
  5. Validação dos dados. A garantia da qualidade dos dados carregados é assegurada pelo processo de conversão e no exame feito pelos clientes.  

Fonte:http://www.efagundes.com/artigos/Quais%20informacoes%20devem%20ser%20armazenadas%20no%20data%20warehouse.htm