ClusterControl CMON HA för distribuerad databas hög tillgänglighet

I den första delen slutade vi med ett fungerande cmon HA-kluster:

[email protected]:~# s9s controller --list --long

S VERSION    OWNER GROUP NAME            IP PORT COMMENT

l 1.7.4.3565 system admins 10.0.0.101      10.0.0.101 9501 Acting as leader.

f 1.7.4.3565 system admins 10.0.0.102      10.0.0.102 9501 Accepting heartbeats.

f 1.7.4.3565 system admins 10.0.0.103      10.0.0.103 9501 Accepting heartbeats.

Total: 3 controller(s)

Vi har tre noder igång, en agerar som ledare och de återstående är följare, som är tillgängliga (de tar emot hjärtslag och svarar på dem). Den återstående utmaningen är att konfigurera UI-åtkomst på ett sätt som gör att vi alltid kan komma åt UI på ledarnoden. I det här blogginlägget kommer vi att presentera en av de möjliga lösningarna som gör att du kan åstadkomma just det.

Konfigurera HAProxy

Det här problemet är inte nytt för oss. Med varje replikeringskluster, MySQL eller PostgreSQL spelar det ingen roll, det finns en enda nod dit vi ska skicka våra skrivningar till. Ett sätt att åstadkomma det skulle vara att använda HAProxy och lägga till några externa kontroller som testar nodens tillstånd och baserat på det returnerar korrekta värden. Detta är i princip vad vi ska använda för att lösa vårt problem. Vi kommer att använda HAProxy som en väl beprövad lager 4-proxy och vi kommer att kombinera den med lager 7 HTTP-kontroller som vi kommer att skriva just för vårt användningsfall. Först till kvarn, låt oss installera HAProxy. Vi kommer att samlokalisera den med ClusterControl, men den kan lika väl installeras på en separat nod (helst noder - för att ta bort HAProxy som den enda punkten för fel).

apt install haproxy

Detta ställer in HAProxy. När det är klart måste vi introducera vår konfiguration:

global

        pidfile /var/run/haproxy.pid

        daemon

        user haproxy

        group haproxy

        stats socket /var/run/haproxy.socket user haproxy group haproxy mode 600 level admin

        node haproxy_10.0.0.101

        description haproxy server



        #* Performance Tuning

        maxconn 8192

        spread-checks 3

        quiet

defaults

        #log    global

        mode    tcp

        option  dontlognull

        option tcp-smart-accept

        option tcp-smart-connect

        #option dontlog-normal

        retries 3

        option redispatch

        maxconn 8192

        timeout check   10s

        timeout queue   3500ms

        timeout connect 3500ms

        timeout client  10800s

        timeout server  10800s



userlist STATSUSERS

        group admin users admin

        user admin insecure-password admin

        user stats insecure-password admin



listen admin_page

        bind *:9600

        mode http

        stats enable

        stats refresh 60s

        stats uri /

        acl AuthOkay_ReadOnly http_auth(STATSUSERS)

        acl AuthOkay_Admin http_auth_group(STATSUSERS) admin

        stats http-request auth realm admin_page unless AuthOkay_ReadOnly

        #stats admin if AuthOkay_Admin



listen  haproxy_10.0.0.101_81

        bind *:81

        mode tcp

        tcp-check connect port 80

        timeout client  10800s

        timeout server  10800s

        balance leastconn

        option httpchk

#        option allbackups

        default-server port 9201 inter 20s downinter 30s rise 2 fall 2 slowstart 60s maxconn 64 maxqueue 128 weight 100

        server 10.0.0.101 10.0.0.101:443 check

        server 10.0.0.102 10.0.0.102:443 check

        server 10.0.0.103 10.0.0.103:443 check

Du kanske vill ändra några av sakerna här som nod- eller backend-namnen som här inkluderar IP:n för vår nod. Du kommer definitivt att vilja byta servrar som du kommer att ha inkluderad i din HAProxy.

De viktigaste bitarna är:

        bind *:81

HAProxy lyssnar på port 81.

        option httpchk

Vi har aktiverat lager 7-kontroll på backend-noderna.

        default-server port 9201 inter 20s downinter 30s rise 2 fall 2 slowstart 60s maxconn 64 maxqueue 128 weight 100

Layer 7-kontrollen kommer att utföras på port 9201.

När detta är gjort, starta HAProxy.

Konfigurera xinetd och Check Script

Vi kommer att använda xinetd för att utföra kontrollen och returnera korrekta svar till HAProxy. Steg som beskrivs i detta stycke ska utföras på alla cmon HA-klusternoder.

Installera först xinetd:

[email protected]:~# apt install xinetd

När detta är gjort måste vi lägga till följande rad:

cmonhachk       9201/tcp

till /etc/services - detta gör att xinetd kan öppna en tjänst som lyssnar på port 9201. Sedan måste vi lägga till själva tjänstefilen. Det bör finnas i /etc/xinetd.d/cmonhachk:

# default: on

# description: cmonhachk

service cmonhachk

{

        flags           = REUSE

        socket_type     = stream

        port            = 9201

        wait            = no

        user            = root

        server          = /usr/local/sbin/cmonhachk.py

        log_on_failure  += USERID

        disable         = no

        #only_from       = 0.0.0.0/0

        only_from       = 0.0.0.0/0

        per_source      = UNLIMITED

}

Äntligen behöver vi kontrollskriptet som anropas av xinetd. Enligt definitionen i servicefilen finns den i /usr/local/sbin/cmonhachk.py.

#!/usr/bin/python3.5



import subprocess

import re

import sys

from pathlib import Path

import os



def ret_leader():

    leader_str = """HTTP/1.1 200 OK\r\n

Content-Type: text/html\r\n

Content-Length: 48\r\n

\r\n

<html><body>This node is a leader.</body></html>\r\n

\r\n"""

    print(leader_str)



def ret_follower():

    follower_str = """

HTTP/1.1 503 Service Unavailable\r\n

Content-Type: text/html\r\n

Content-Length: 50\r\n

\r\n

<html><body>This node is a follower.</body></html>\r\n

\r\n"""

    print(follower_str)



def ret_unknown():

    unknown_str = """

HTTP/1.1 503 Service Unavailable\r\n

Content-Type: text/html\r\n

Content-Length: 59\r\n

\r\n

<html><body>This node is in an unknown state.</body></html>\r\n

\r\n"""

    print(unknown_str)



lockfile = "/tmp/cmonhachk_lockfile"



if os.path.exists(lockfile):

    print("Lock file {} exists, exiting...".format(lockfile))

    sys.exit(1)



Path(lockfile).touch()

try:

    with open("/etc/default/cmon", 'r') as f:

        lines  = f.readlines()



    pattern1 = "RPC_BIND_ADDRESSES"

    pattern2 = "[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}"

    m1 = re.compile(pattern1)

    m2 = re.compile(pattern2)



    for line in lines:

        res1 = m1.match(line)

        if res1 is not None:

            res2 = m2.findall(line)

            i = 0

            for r in res2:

                if r != "127.0.0.1" and i == 0:

                    i += 1

                    hostname = r



    command = "s9s controller --list --long | grep {}".format(hostname)

    output = subprocess.check_output(command.split())

    state = output.splitlines()[1].decode('UTF-8')[0]

    if state == "l":

        ret_leader()

    if state == "f":

        ret_follower()

    else:

        ret_unknown()

finally:

    os.remove(lockfile)

När du har skapat filen, se till att den är körbar:

chmod u+x /usr/local/sbin/cmonhachk.py

Idén bakom det här skriptet är att det testar statusen för noderna med kommandot "s9s controller --list --long" och sedan kontrollerar det utdata som är relevant för IP:n som det kan hitta på lokal nod. Detta gör att skriptet kan avgöra om värden som det körs på är en ledare eller inte. Om noden är ledaren returnerar skriptet "HTTP/1.1 200 OK"-kod, som HAProxy tolkar som att noden är tillgänglig och dirigerar trafiken till den. Annars returnerar det "HTTP/1.1 503 Service Unavailable", vilket behandlas som en nod, som inte är frisk och trafiken kommer inte att dirigeras dit. Som ett resultat, oavsett vilken nod som kommer att bli en ledare, kommer HAProxy att upptäcka den och markera den som tillgänglig i backend:

Du kan behöva starta om HAProxy och xinetd för att tillämpa konfigurationsändringar innan alla delar kommer att börja fungera korrekt.

Att ha mer än en HAProxy säkerställer att vi har ett sätt att komma åt ClusterControl UI även om en av HAProxy-noderna skulle misslyckas men vi har fortfarande två (eller flera) olika värdnamn eller IP att ansluta till ClusterControl UI. För att göra det mer bekvämt kommer vi att distribuera Keepalved ovanpå HAProxy. Den kommer att övervaka tillståndet för HAProxy-tjänster och tilldela virtuell IP till en av dem. Om den HAProxy skulle bli otillgänglig kommer VIP att flyttas till en annan tillgänglig HAProxy. Som ett resultat kommer vi att ha en enda ingångspunkt (VIP eller ett värdnamn kopplat till det). Stegen vi tar här måste utföras på alla noder där HAProxy har installerats.

Låt oss först installera Keepalive:

apt install keepalived

Då måste vi konfigurera det. Vi använder följande konfigurationsfil:

vrrp_script chk_haproxy {

   script "killall -0 haproxy"   # verify the pid existance

   interval 2                    # check every 2 seconds

   weight 2                      # add 2 points of prio if OK

}

vrrp_instance VI_HAPROXY {

   interface eth1                # interface to monitor

   state MASTER

   virtual_router_id 51          # Assign one ID for this route

   priority 102                   

   unicast_src_ip 10.0.0.101

   unicast_peer {

      10.0.0.102

10.0.0.103



   }

   virtual_ipaddress {

       10.0.0.130                        # the virtual IP

   } 

   track_script {

       chk_haproxy

   }

#    notify /usr/local/bin/notify_keepalived.sh

}

Du bör ändra den här filen på olika noder. IP-adresser måste konfigureras korrekt och prioritet bör vara olika på alla noder. Vänligen konfigurera även VIP som är vettigt i ditt nätverk. Du kanske också vill ändra gränssnittet - vi använde eth1, vilket är där IP:n tilldelas på virtuella maskiner skapade av Vagrant.

Starta Keepalive med den här konfigurationsfilen och du bör vara igång. Så länge VIP är uppe på en HAProxy-nod bör du kunna använda den för att ansluta till rätt ClusterControl-gränssnitt:

Detta avslutar vår tvådelade introduktion till ClusterControl högt tillgängliga kluster. Som vi sa i början är detta fortfarande i betaläge men vi ser fram emot feedback från dina tester.

ClusterControl CMON HA för distribuerad databas hög tillgänglighet - del två (GUI Access Setup)

Konfigurera HAProxy

Konfigurera xinetd och Check Script