.
Recurso patrocinado Os volumes de dados globalmente estão aumentando a uma taxa insana. De acordo com a empresa de inteligência de mercado IDC, os dados do mundo crescerão para 175 zettabytes em 2025 – um volume de dados que, se copiado para a mídia BluRay, criaria uma pilha de discos que abrange a distância entre a Terra e a Lua 23 vezes.
Esse tsunami de informações não mostra sinais de diminuir, com dados totais que devem mais do que dobrar de tamanho entre 2022 e 2026, diz John Rydning, vice-presidente de pesquisa do Global DataSphere da IDC. Ele prevê que os dados corporativos crescerão duas vezes mais rápido que os dados do consumidor nos próximos cinco anos, “colocando ainda mais pressão nas organizações corporativas para gerenciar e proteger os dados do mundo, criando oportunidades para ativar os dados para benefícios comerciais e sociais”.
Johnson Noel é gerente sênior de soluções técnicas da Hazelcast, uma plataforma de processamento de fluxo em tempo real. Ele concorda que as empresas estão enfrentando nada menos que uma “explosão de dados”.
“Se você não pode lidar com os volumes de dados como eles estão atualmente – se você não pode cumprir seus acordos de nível de serviço agora – você não terá chance em cinco anos quando esse volume de dados quadruplicar ou aumentar ainda mais,” avisa Noel.
“Muitas empresas simplesmente não sabem como lidar com essas informações. Algumas podem nem estar cientes do valor que esses dados têm e, geralmente, não fazem nada a respeito. Mas essas informações são vitais porque são o coração e os pulmões de seus negócios.”
Acordando para o processamento de dados em tempo real
À luz dessas preocupações, Noel acredita que as empresas voltadas para o futuro estão despertando para a importância do processamento de dados em “tempo real” para maximizar o valor comercial de seus recursos de dados. Essas plataformas de tempo real são uma escolha cada vez mais popular para organizações que frequentemente armazenam e processam grandes volumes de transações digitais, mas enquanto alguns bancos de dados apresentam opções nativas de cache, eles podem adicionar atrasos críticos de microssegundos e latência à equação. O problema pode ser particularmente pronunciado para serviços financeiros, comércio eletrônico, saúde e agências governamentais, onde a capacidade de ler/gravar dados em tempo real determina o sucesso ou o fracasso de “um momento no tempo”.
“Quando começamos a falar sobre alguns dos desafios de dados enfrentados pelas empresas, fica claro que sempre houve problemas a serem superados, mas agora, quando estamos no mundo em tempo real, esses problemas são muito mais sérios e muito mais prevalentes. Então muito mais dados estão sendo gerados e estão se movendo muito mais rápido do que antes. E mais dados introduzem maiores variedades, fontes, formatos e maior possibilidade de esparsidade e veracidade dos dados.” acrescenta Noel.
“Se as empresas pudessem fornecer insights em tempo real, elas obteriam benefícios, mas invariavelmente no momento muitas delas não são capazes de fazer isso porque não têm os recursos necessários.”
Para ajudar a resolver os problemas associados ao processamento de volumes crescentes de dados em tempo real, a Hazelcast desenvolveu uma plataforma de processamento de fluxo em tempo real que permite que as empresas criem aplicativos com facilidade e rapidez que atuem imediatamente nos dados. O Hazelcast é uma plataforma de processamento de fluxo em tempo real, integrada com armazenamento de baixa latência e inferência de aprendizado de máquina.
Além de distribuir dados em armazenamento de baixa latência (uma combinação de memória e SSDs de alto desempenho), o Hazelcast fornece um conjunto de APIs para acessar as CPUs em um cluster para máxima velocidade de processamento. Assim, no Hazelcast, a RAM e o armazenamento local de todos os membros do cluster são combinados em um único armazenamento de dados de baixa latência para fornecer acesso rápido aos dados. Esse modelo distribuído é projetado para tornar os dados das organizações tolerantes a falhas e escaláveis, porque, se um único membro cair, os backups dos dados críticos primários são reequilibrados entre os membros restantes.
Noel observa que a vantagem do armazenamento distribuído de baixa latência é que ele fornece a capacidade de ter acesso de alto desempenho aos dados, ao mesmo tempo em que oferece a capacidade de aumentar e reduzir a capacidade de forma elástica.
Ele acrescenta que o Hazelcast fornece a base para desenvolver e implantar aplicativos rápidos e escaláveis para que as empresas executem cálculos, simulações e outras cargas de trabalho com uso intensivo de dados e computação em grande escala em tempo real. Ele também acelera as transações das empresas reduzindo significativamente a latência de acesso aos dados por meio do armazenamento de dados em camadas, provenientes de muitos armazenamentos de dados distintos.
É claro que alguns provedores de tecnologia afirmam, mas não fornecem, processamento de dados em tempo real: “Existem alguns provedores por aí que dizem que fazem em tempo real, mas tudo o que fazem é coletar as informações em tempo real. Mas então eles terminam tendo que carregar em um banco de dados ou algum outro serviço e, em seguida, fazer o processamento e, claro, é tarde demais.” explica Noel.
“O verdadeiro tempo real envolve continuamente coletar, analisar, canonizar e executar funções (como processamento contra regras ou modelos de aprendizado de máquina) nos dados ‘fluxo’ fora de um banco de dados ou qualquer outro serviço – em outras palavras, todo o processo deve ser executado em armazenamento de latência muito baixa e entregue aos usuários ou processos downstream muito antes de tocar em um banco de dados.”
Noel acrescenta que o processamento de dados da Hazelcast oferece benefícios comerciais: “O processamento é uma área em que nos diferenciamos de outras soluções convencionais. A ideia de processar dados é realmente poder acessar imediatamente os dados criados, enriquecê-los e fornecer informações em tempo real tempo, para que ações possam ser tomadas imediatamente para entregar o valor que de outra forma teria sido perdido”.
“Trata-se de garantir que você faça as ligações certas a tempo, o tempo todo.”
Os bancos melhoram os tempos de resposta ao cliente
Os benefícios comerciais do processamento de dados em tempo real certamente foram atraentes para o BNP Paribas Bank Polska, que implantou uma arquitetura orientada a eventos para aumentar as oportunidades de receita. A instituição financeira, membro do grupo bancário BNP Paribas, cuja presença abrange 71 países, empreendeu recentemente uma iniciativa para aumentar a adoção de seus produtos.
Isso incluiu a promoção de empréstimos pessoais a qualquer cliente cujo saldo da conta bancária fosse baixo e não pudesse fornecer o valor solicitado em um caixa eletrônico. No entanto, a infraestrutura orientada a lotes implantada anteriormente pelo banco com base em CRM e tecnologia de data warehouse significava que normalmente levaria até dois dias para apresentar uma oferta ao cliente.
Para acelerar esse processo de resposta, a equipe de TI do BNP Paribas conectou a plataforma de processamento de fluxo em tempo real da Hazelcast em seu barramento de mensagens de publicação/assinatura existente e transformou o ambiente em uma arquitetura orientada a eventos. Isso lhe deu a capacidade de atuar em eventos em tempo real, especialmente porque eles já estavam capturando informações sobre as interações dos clientes.
À medida que os dados do evento eram lidos pelo Hazelcast, eles eram rapidamente complementados com pesquisas de dados no armazenamento de baixa latência, o que fornecia o contexto necessário para tomar melhores decisões sobre como responder ao cliente. Todo o evento poderia então ser publicado de volta no barramento para uso dos processos downstream. Um exemplo de ação downstream é enviar ao cliente uma mensagem SMS sobre uma oferta de produto, que pode ser enviada imediatamente após o evento.
“Quando começamos, não sabíamos se o sistema poderia suportar os diferentes tipos de lógica de negócios e os volumes de campanha esperados para que este fosse um esforço viável”, afirmou Szymon Domagala, Enterprise Architect, BNP Paribas Bank Polska.
“Mas foi fácil e relativamente barato começar a ver como o software poderia funcionar. E obtivemos bons resultados, pois a taxa de conversão da oferta é quatro vezes maior do que antes e as campanhas são lucrativas.”
Os serviços baseados em nuvem adicionam mais flexibilidade
Noel da Hazelcast aponta que, enquanto a maioria dos clientes corporativos de sua empresa atualmente implantam a tecnologia Hazelcast no local com equipes internas de TI responsáveis por implementações e gerenciamento de software e hardware, há uma tendência crescente para a adoção de software baseado em nuvem – como ofertas de serviço. Um deles é o Hazelcast Viridian Serverless, que é um serviço gerenciado em nuvem de autoatendimento e pagamento conforme o uso. Outro é o Hazelcast Viridian Dedicated, a versão contratualmente licenciada da empresa de seu serviço gerenciado em nuvem que oferece servidores específicos dedicados (instâncias em nuvem) para os clientes.
“Esperamos ver movimentos [towards cloud-based services] de clientes que estão usando no local naquele momento. Talvez eles não queiram mais administrar o meio ambiente. Nossos serviços em nuvem permitem que eles se concentrem em seus aplicativos, em vez de se concentrar em problemas de infraestrutura. Demos a eles a flexibilidade de escolha”, explica Noel.
Trabalhando na próxima etapa lógica além dos dados em tempo real, Noel aponta para a operacionalização de modelos de aprendizado de máquina. O uso das tecnologias da Hazelcast, explica ele, permite que você crie soluções que extrapolem dados em tempo real para prever eventos que ainda não aconteceram.
Por exemplo, estão sendo considerados aplicativos para o setor de saúde que podem prever se uma doença que afeta um paciente vai melhorar ou piorar – com base em informações que estão sendo coletadas em tempo real. Esses aplicativos podem monitorar sinais vitais de pacientes hospitalares, incluindo saturação de oxigênio, batimentos cardíacos, temperatura e pressão arterial, e esses dados em tempo real são carregados no Hazelcast e enriquecidos com contexto e significado, registro por registro, imediatamente, prontos para os médicos agirem com base nesses dados.
“Com todas essas informações, um clínico pode dizer se a saúde de um paciente está mudando e o aplicativo pode categorizar isso em termos de urgência – alta, média ou baixa – para mostrar se uma pessoa requer ou exigirá atenção urgente”, diz Noel .
“Você pode criar aplicativos de saúde que podem prever (usando um modelo de aprendizado de máquina) se esse paciente pode precisar de atenção urgente, então você está se tornando mais proativo em vez de reativo. Tempo real significa que você está respondendo a alguém que acabou de adoecer. Prever que eles vão adoecer é ainda melhor do que em tempo real, e fornecemos a plataforma para operacionalizar modelos pré-construídos para serem executados em fluxo quando os dados são criados”.
As vantagens oferecidas pelas plataformas de processamento de dados em tempo real não se limitam ao setor bancário e de saúde, é claro – qualquer organização que luta para acomodar grandes volumes de informações constantemente atualizadas pode se beneficiar. Eles só precisam saber a melhor maneira de lidar com isso primeiro.
Você pode descobrir mais sobre a plataforma Hazelcast Real-Time Stream Processing participando desta conferência gratuita, virtualmente ou pessoalmente, em Londres em 9º Março – cabeça aqui para se cadastrar e acessar mais detalhes.
Patrocinado pela Hazelcast.
.