Replicação de dados

Segundo Coulouris et al. (2013) replicação é a chave para prover alta disponibilidade e tolerância a falhas em sistemas distribuídos. A alta disponibilidade é um tópico de crescente interesse, principalmente com a atual tendência em direção à computação móvel e à operação desconectada. A tolerância a falhas é uma preocupação permanente dos serviços fornecidos em sistemas nos quais a segurança funcional (safety) é fundamental e em outros tipos importantes de serviços e sistemas.

A replicação é uma técnica para melhorar serviços. As motivações para a replicação são: melhorar o desempenho de um serviço, aumentar sua disponibilidade ou torná-lo tolerante a falhas.

  • Melhoria de desempenho: a colocação dos dados em cache de clientes e servidores é uma maneira conhecida de melhorar o desempenho.

A replicação de dados imutáveis é simples: ela aumenta o desempenho com pouco custo para o sistema. A replicação de dados mutáveis (dinâmicos), como os da Web, acarreta sobrecargas nos protocolos para garantir que os clientes recebam dados atualizados. Assim, existem limites para a eficácia da replicação como uma técnica de melhoria de desempenho.

  • Tolerância a falhas: dados de alta disponibilidade não são necessariamente dados rigorosamente corretos. Eles podem estar desatualizados, por exemplo, ou dois usuários em lados opostos de uma rede que foi particionada podem fazer atualizações conflitantes e que precisem ser resolvidas. Em contraste, um serviço tolerante a falhas sempre garante comportamento rigorosamente correto, apesar de certo número e tipo de falhas. A correção está relacionada ao caráter atual dos dados fornecidos para o cliente e aos efeitos das operações do cliente sobre os dados. Às vezes, a correção também está relacionada ao tipo de respostas do serviço – como, por exemplo, no caso de um sistema de controle de tráfego aéreo, no qual dados corretos são necessários em escalas de tempo curtas.

A replicação de dados pode ser realizada via software, quando nos referimos há algumas linhas específicas numa determinada tabela ou ainda um banco de dados. Por outro lado, quando precisamos replicar um volume ou um disco, é comum recorrermos a replicação de hardware.

O uso da replicação permite o uso de vários níveis de granularidade. A replicação de banco de dados, por exemplo, permite desde a replicação de algumas linhas ou colunas específicas até um conjunto de várias tabelas ou eventualmente um banco de dados inteiro.

A replicação de dados é uma das tecnologias mais empregadas para a construção de banco de dados distribuídos.

Funcionamento

A replicação é uma técnica para manter automaticamente a disponibilidade dos dados, a despeito das falhas do servidor. Se os dados são replicados em dois ou mais servidores que falham independentemente, então o software cliente pode acessar os dados em um servidor alternativo, caso o servidor padrão falhe ou se torne inacessível.

Na seguinte imagem, visualizamos uma implementação de replicação. Inicialmente a aplicação submete instruções de escrita (insert, update, delete) para o banco de dados.

Exemplo de replicação de dados

Inicialmente a aplicação submete instruções de escrita (insert, update, delete) para o banco de dados. Alterando, posteriormente esse banco de dados é replicado para suas quatro cópias, mantendo-as sincronizadas. Considerando que as réplicas são idênticas ao banco de dados original, uma consulta pode ser feita em qualquer uma das réplicas provendo assim cenários de alta disponibilidade e escalabilidade. A indisponibilidade do banco principal, não compromete as consultas. Uma vez que o banco principal esteja disponível, é possível redirecionar as operações de escritas para uma das réplicas.

Aplicabilidade

  • Prover disponibilidade do dado em outros sites no caso da queda do principal.
  • Diminuir a contenção em um único site, uma vez que o dado em múltiplos sites evita a concentração de acessos.
  • Possibilitar processamento paralelo distribuído entre os sites.
  • Melhorar o desempenho aproximado do dado do seu consumidor, evitando assim atrasos na transmissão em links considerados lentos.
  • Permitir o uso dos dados em aplicações desconectadas, pois essas podem trabalhar de forma off-line e replicar os dados posteriormente.

Arquitetura de uma replicação

Servidores trabalham com um modelo de gerenciador de réplicas, esse gerenciador tem o papel de:

Coordenar o processo de replicação:

  • Manter a consistência de estado e transparência do conjunto dos servidores.
  • Manter o controle da concorrência;
  • E fazer o controle de falhas de servidores.

Tipos de Replicação:

  • Replicação passiva;
  • Replicação ativa.

Replicação Passiva (backup primário)

No modelo passivo, ou de backup primário, de replicação para tolerância a falhas, existe, em determinado momento, um único gerenciador de réplica (RM) primário e um ou mais gerenciadores de réplica secundários – backups ou escravos. Na forma pura do modelo, os front-ends (FE) se comunicam somente com o gerenciador de réplica primário para obterem o serviço. O gerenciador de réplica primário executa as operações e envia cópias dos dados atualizados para os backups. Se o primário falhar, um dos backups será promovido para atuar como primário.

O modelo passivo (backup primário) de tolerância a falhas.
  1. A sequência de eventos, quando um cliente solicita que uma operação seja executada, é a seguinte:
  2. Requisição: o front-end emite a requisição, contendo um identificador exclusivo, para o gerenciador de réplica primário.
  3. Coordenação: o gerenciador primário trata cada requisição atomicamente, na ordem em que a recebe. Ele verifica o identificador exclusivo, para o caso de já a ter executado e, se assim for, simplesmente envia a resposta novamente.
  4. Execução: o gerenciador primário executa a requisição e armazena a resposta.
  5. Acordo: se a requisição é uma atualização, o gerenciador primário envia o estado atualizado, a resposta e o identificador exclusivo para todos os gerenciadores de backup. Os gerenciadores de backup enviam uma confirmação.
  6. Resposta: o gerenciador primário responde para o front-end, o qual envia a resposta de volta para o cliente.

Detecção de falha do primário

Detecção de falha no backup primário
  • Cliente estabelece timeout para requisição;
  • Backups fazem verificação (keepalive).

Solução: Um novo primário é eleito.

Casos:

  • Antes de iniciar o update;
  • Durante ou após o update, mas antes de enviar a resposta ao cliente;
  • Após enviar a resposta ao cliente.

Vantagens e desvantagens da Replicação Passiva

Vantagens:

  • Réplicas não precisam obter sempre o mesmo efeito para uma certa requisição.
  • Interação simples entre cliente e servidor.

Desvantagens:

  • A frequência de checkpoints pode prejudicar o desempenho do serviço replicado.

       Solução: fazer update a cada n requisições.

  • Cliente retransmite requisições entre o último update realizado e a falha do primário.
  • Um mecanismo de log em disco armazena todas as requisições desde o último checkpoint.

Replicação Ativa

No modelo ativo de replicação para tolerância a, os gerenciadores de réplica são máquinas de estado que desempenham papéis equivalentes e são organizados como um grupo. Os front-ends enviam suas requisições por multicast para o grupo de gerenciadores de réplica, e todos os gerenciadores de réplica processam a requisição independentemente, mas de forma idêntica, e respondem. Se qualquer gerenciador de réplica falhar, isso não tem nenhum impacto sobre o desempenho do serviço, pois os gerenciadores de réplica restantes continuam a responder normalmente. Veremos que a replicação ativa pode tolerar falhas bizantinas, pois o front-end pode reunir e comparar as respostas que recebe.

Replicação ativa

Sob a replicação ativa, a sequência de eventos quando um cliente solicita a execução de uma operação é a seguinte:

  1. Requisição: o front-end anexa um identificador exclusivo à requisição e a envia por multicast para o grupo de gerenciadores de réplica, usando uma primitiva de multicast totalmente ordenada e confiável. Supõe-se que o front-end pode falhar por colapso, na pior das hipóteses. Ele não emite a próxima requisição até que tenha recebido uma resposta.
  2. Coordenação: o sistema de comunicação em grupo envia a requisição para cada gerenciador de réplica correto na mesma ordem (total).
  3. Execução: todos os gerenciadores de réplica executam a requisição. Como eles são máquinas de estado, e como as requisições são distribuídas na mesma ordem total, todos os gerenciadores de réplica corretos processam a requisição de forma idêntica. A resposta contém o identificador de requisição exclusiva do cliente.
  4. Acordo: nenhuma fase de acordo é necessária, devido à semântica da distribuição por multicast.
  5. Resposta: cada gerenciador de réplica envia sua resposta para o front-end. O número de respostas reunidas pelo front-end depende das suposições de falha e do algoritmo de multicast. Se, por exemplo, o objetivo for tolerar apenas falhas por colapso e o multicast satisfizer o acordo uniforme e as propriedades de ordenação, o front- -end passará ao cliente a primeira resposta que chegar e descartará as restantes (ele pode distingui-las das respostas de outras requisições examinando o identificador presente na resposta).

Recuperação de falhas

A recuperação é feita através de uma:

  • Atualização do estado;
  • Execução das requisições perdidas.

Exige que as réplicas tenham comportamento determinístico: A requisição deve produzir o mesmo efeito em todas as réplicas. Caso contrário, pode ocorrer divergência de estados.

Exige atomicidade na comunicação: Uma certa requisição é recebida por todas as réplicas ou, então, não é recebida por nenhuma réplica.

Exige ordenação na comunicação: Todas as réplicas recebem as mensagens (requisições) na mesma ordem.

Vantagens e desvantagens da Replicação Ativa

Vantagens
  • Falhas são mascaradas quase que instantaneamente.
  • Adequada para aplicações que exigem serviços ininterruptos e com sobrecarga mínima em situações de falha, como aplicações de tempo real.
  • Cobre um amplo espectro de faltas: crash, omissão, temporização e valor.
Desvantagens
  • Tem alto custo na comunicação.
  • Exige muitos recursos do sistema (memória, processador).

Principais desafios da replicação

Os dados em grandes corporações estão cada vez mais volumosos. O principal entrave é que o tamanho da largura da banda, necessária para trafegar as informações, não acompanha o crescimento na mesma proporção que o armazenamento. As estratégias de replicação ativo-ativo são, portanto, as mais interessantes, mesmo requerendo mudanças de softwares para o funcionamento transparente em data centers. Esses são desafios que novas tecnologias de banco de dados, como o NoSQL e ferramentas de big data, são capazes de resolver de maneira nativa, sem que haja a necessidade de aquisição de softwares específicos para essa finalidade.

Existem, ainda, alternativas que permitem que a replicação seja feita em ambientes internos com um único datacenter. Um bom exemplo disso são os de Hadoop, que replicam as informações, por padrão, três vezes dentro de seu próprio espaço. Para empresas menores, onde não há a possibilidade de investimento em outros datacenters, é importante garantir a alta disponibilidade por meio de serviços com arquitetura nativa de replicação, como a NoSQL e as ferramentas de big data. Hoje a melhor forma de se armazenar, recuperar e analisar as informações em um único ambiente utilizando big data é por meio de sistemas preparados de forma nativa para conseguir obter resultados de alta disponibilidade com a replicação de dados.

Atualidade

Atualmente, as grandes corporações não podem se dar ao luxo de terem suas operações interrompidas, independentemente do motivo. A rápida recuperação de sistemas após desastres naturais, como enchentes, incêndios, panes elétricas, terremotos, furacões ou tempestades é uma das maiores preocupações nas companhias. Soluções que permitem a continuidade operacional, mesmo após um evento catastrófico, são cada vez mais bem vistas e utilizadas.

Nesse aspecto, a replicação de dados torna-se uma saída interessante para as empresas que buscam a rápida recuperação depois de uma fatalidade. Essas ferramentas são usadas, normalmente, por companhias que possuem mais de uma estrutura de data center. Assim, se ocorrer um problema em um deles, é possível continuar com as operações normalmente a partir de outro centro de processamento. Para a implementação, o custo pode ser considerado alto. Nesses casos, é importante que as empresas ponderem se o valor por ter a operação parada por dias ou semanas é menor do que o de implantação de replicação. Dependendo da conclusão, é fundamental que haja uma reavaliação das estratégias de recuperação, validando a necessidade de um novo datacenter. Esse, por sua vez, normalmente deve ser instalado em região geográfica distante do original.

Ícone de esboço Este artigo sobre informática é um esboço. Você pode ajudar a Wikipédia expandindo-o.

Veja também

Read other articles:

Nora AunorAunor in 2011LahirNora Cabaltera Villamayor21 Mei 1953 (umur 70)Iriga, Camarines Sur, FilipinaKebangsaanFilipinoNama lainAte GuyPekerjaanAktrisprodusersutradarapenyanyiTahun aktif1967–sekarangSuami/istriChristopher de Leon (1975–1980; bercerai 1996)Anak5 (1 anak kandung, 4 anak angkat termasuk Lotlot de Leon and Matet de Leon)Situs webtheartistryofnoraaunor.com Nora Aunor (lahir Nora Cabaltera Villamayor ; 21 Mei 1953) [1] adalah seorang aktris, peny...

 

علاقات البحرين والاتحاد الأوروبي   الاتحاد الأوروبي   البحرين تعديل مصدري - تعديل   علاقات البحرين والاتحاد الأوروبي والعلاقات الدولية بين مملكة البحرين في الخليج العربي والاتحاد الأوروبي. التاريخ كجزء من مجلس التعاون لدول الخليج العربية وقعت البحرين اتفاقي...

 

Performing arts conservatory of Johns Hopkins University For the other Peabody Institutes, see Peabody Institute (Danvers, Massachusetts) and Peabody Institute Library (Peabody, Massachusetts). This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Peabody Institute – news · newspapers · books · scholar · JSTOR (Ju...

Estonian footballer and manager Argo Arbeiter Personal informationFull name Argo ArbeiterDate of birth (1973-12-05) 5 December 1973 (age 50)Place of birth Viljandi, EstoniaHeight 1.81 m (5 ft 11+1⁄2 in)Position(s) ForwardTeam informationCurrent team Nõmme Kalju (sporting director)Senior career*Years Team Apps (Gls)1992 Viljandi 1992–1998 Flora 1993–1996 → Tervis Pärnu (loan) 1996–1997 → Lelle (loan) 1997–1998 → Viljandi (loan) 1998–2000 KTP 2000–2...

 

العلاقات السودانية الكورية الجنوبية السودان كوريا الجنوبية   السودان   كوريا الجنوبية تعديل مصدري - تعديل   العلاقات السودانية الكورية الجنوبية هي العلاقات الثنائية التي تجمع بين السودان وكوريا الجنوبية.[1][2][3][4][5] مقارنة بين البلدين هذه �...

 

Radio station in Paris, IllinoisWIBUSimulcasting WIBQ Terre Haute, IndianaParis, IllinoisBroadcast areaTerre Haute, IndianaFrequency1440 kHzBrandingThe Talk Station 97.9, 1230, 1440ProgrammingFormatDefunct (formerly News/talk)AffiliationsFox News RadioCompass Media NetworksGenesis Communications NetworkPremiere NetworksWestwood OneOwnershipOwnerDuey E. Wright(Midwest Communications, Inc.)Sister stationsWIBQHistoryFirst air date1951 (as WPRS)Former call signsWPRS (1951–2017)WBOW (2017)Call s...

Guerre seminoleVillaggio SeminoleData1817 - 1858 LuogoFlorida, Stati Uniti EsitoEsaurimento, con la maggior parte della tribù deportata in Oklahoma, e una parte minore rimasta libera nelle paludi fino ai giorni nostri[1] Schieramenti Stati UnitiSeminole Yuchi Choctaw Liberti Comandanti Andrew Jackson Martin Van Buren William Henry Harrison John Tyler Duncan Lamont Clinch Edmund P. Gaines Winfield Scott Thomas Jesup Richard Gentry † David Moniac † Francis Langhorne Dade † Zachar...

 

Синелобый амазон Научная классификация Домен:ЭукариотыЦарство:ЖивотныеПодцарство:ЭуметазоиБез ранга:Двусторонне-симметричныеБез ранга:ВторичноротыеТип:ХордовыеПодтип:ПозвоночныеИнфратип:ЧелюстноротыеНадкласс:ЧетвероногиеКлада:АмниотыКлада:ЗавропсидыКласс:Пт�...

 

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Oktober 2022. Ini bibliografi karya penulis novel dan esai, Virginia Woolf. Novel The Voyage Out (1915) Night and Day (1919) Jacob's Room (1922) Mrs Dalloway (1925) To the Lighthouse (1927) Orlando: A Biography (1928) The Waves (1931) The Years (1937) Between the Ac...

Mitsubishi J2M Raiden (雷电, Thunderbolt) adalah pesawat tempur berbasis darat bermesin tunggal yang digunakan oleh Angkatan Laut Kekaisaran Jepang di Perang Dunia II. Nama laporan Sekutunya adalah Jack. J2M ini dirancang oleh Jiro Horikoshi, pencipta A6M Zero untuk memenuhi spesifikasi resmi 14-Shi (tahun ke-14 dari pemerintahan Showa, atau 1939). Referensi Air Enthusiast Magazine, July 1971. The Complete Encyclopedia of World Aircraft New York: Barnes & Noble, 1977. ISBN 0-7607-0592-...

 

1960s in music in the UK Number-one singlesNumber-one albumsBest-selling singlesBest-selling albums Events 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 ←1950s 1970s→ The Beatles had the biggest-selling single of 1963 with She Loves You, which topped the chart for six non-consecutive weeks and was one of four top 10 singles in their breakthrough year, which included two other number-ones: From Me to You and I Want to Hold Your Hand. She Loves You would also rank as the best-selling s...

 

МифологияРитуально-мифологическийкомплекс Система ценностей Сакральное Миф Мономиф Теория основного мифа Ритуал Обряд Праздник Жречество Мифологическое сознание Магическое мышление Низшая мифология Модель мира Цикличность Сотворение мира Мировое яйцо Мифическое �...

海尔·塞拉西一世埃塞俄比亚皇帝統治1930年11月2日-1974年9月12日(43年314天)加冕1930年11月2日前任佐迪图繼任阿姆哈·塞拉西一世(流亡)埃塞俄比亞攝政王統治1916年9月27日-1930年11月2日(14年36天)出生(1892-07-23)1892年7月23日 埃塞俄比亚帝国哈勒爾州逝世1975年8月27日(1975歲—08—27)(83歲) 衣索比亞亚的斯亚贝巴安葬2000年11月5日圣三一大教堂配偶梅南·阿斯福(1889年-1962�...

 

Polynesian kingdom ended in 1888 This article possibly contains original research. Please improve it by verifying the claims made and adding inline citations. Statements consisting only of original research should be removed. (April 2023) (Learn how and when to remove this message) Kingdom of Rapa NuiKāinga o Rapa Nui (Rapa Nui)Reino de Rapa Nui (Spanish)c. 4th century – 1888 / 1902 Top: 1880–1899Bottom: 1899–1902 Coat of arms Location of the Kingdom of Easter Island in the S...

 

中国人民解放军新疆军区中国人民解放军陆军军旗存在時期1949年 - 1979年(首设)1985年至今(复设)國家或地區 中华人民共和国部門中国人民解放军陆军種類中国人民解放军陆军直属副战区级军区功能新疆地区的边境防卫,新疆军区的征兵动员規模副战区级规模直屬中国人民解放军陆军总部(管理)中央军委国防动员部(国防动员) 中国人民解放军西部战区(作战)駐�...

Type of clothing Infant bodysuitInfant bodysuit.TypeBaby's clothes Baby in a Wikipedia Hello World onesie An infant bodysuit or onesie (American English) is a garment designed to be worn by babies much like a T-shirt; they are distinguished from T-shirts by an extension below the waist, with snaps that allow it to be closed over the crotch. The purpose of the opening at the crotch is to facilitate access to the infant's diaper as well as preventing the garment from riding up the infant's body...

 

Roman infantry helmet (Imperial Gallic type). Late 1st century This article concerns the Roman auxiliary regiments of the Principate period originally recruited in the western Alpine regions of the empire (for the central/eastern Alps, see Raetorum auxiliary cohorts). The cohortes Alpinorum (cohorts of Alpini) came from Tres Alpes, the three small Roman provinces of the western Alps, Alpes Maritimae, Alpes Cottiae and Alpes Graiae. The cohortes Ligurum were originally raised from the Ligures ...

 

ذئب وحيوان الأبسوم يظهران في قصص عدد من القبائلالأساطير الأمريكية الأصلية (بالإنجليزية: Mythologies of the indigenous peoples of the Americas)‏ تمتلك الشعوب الأصلية في الأمريكتين ثقافات مختلفة متعددة. لكل منهم أساطيره الخاصة. بعضها، إلى حد بعيد، متميز وواضح ومستقل بذاته عن الثقافات الأخرى ويحتف...

2012 Dutch thriller film This article does not cite any sources. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Manslaughter 2012 film – news · newspapers · books · scholar · JSTOR (December 2018) (Learn how and when to remove this message) ManslaughterDirected byPieter KuijpersStarring Theo Maassen Gijs Scholten van Aschat Release date 3 January 20...

 

المصري شعار النادي المصري الاسم الكامل النادي المصري للألعاب الرياضية اللقب النسور الخضر زعيم القناة الاسم المختصر MSC الألوان  المصري  الأخضر   الأبيض   سماوي المؤسس أحمد حسني بك يوسف لهيطة بكمحمد إبراهيم عطا اللهنيقولا تكلاعوض فقوسة عبد الرحمن لطفي باش...