Middleware

Dozent:

Prof. Dr. Michael Eichberg

Kontakt:

michael.eichberg@dhbw-mannheim.de, Raum 149B

Version:

2024-05-09

Folien:

https://delors.github.io/ds-middleware/folien.rst.html

https://delors.github.io/ds-middleware/folien.rst.html.pdf

Fehler auf Folien melden:

https://github.com/Delors/delors.github.io/issues

Einführung in Middleware

Was ist Middleware?

Ein einfacher Server mit Sockets

/* A simple TCP based server. The port number is passed as an argument */
#include <stdio.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>

void error(char *msg){perror(msg); exit(1);}

int main(int argc, char *argv[]){
  int sockfd, newsockfd, portno, clilen;
  char buffer[256]; int n;
  struct sockaddr_in serv_addr, cli_addr;

  sockfd = socket(AF_INET, SOCK_STREAM, 0); // socket() returns a socket descriptor
  if (sockfd < 0)
  error("ERROR opening socket");

  bzero((char *) &serv_addr, sizeof(serv_addr)); // bzero() sets all values to zero.
  portno = atoi(argv[1]); // atoi() converts str into an integer

  ...
  serv_addr.sin_family = AF_INET;
  serv_addr.sin_addr.s_addr = INADDR_ANY;
  serv_addr.sin_port = htons(portno);

  if (bind(sockfd, (struct sockaddr *) &serv_addr, sizeof(serv_addr)) < 0)
  error("ERROR on binding");
  listen(sockfd,5); // tells the socket to listen for connections
  clilen = sizeof(cli_addr);
  newsockfd = accept(sockfd, (struct sockaddr *) &cli_addr, &clilen);
  if (newsockfd < 0) error("ERROR on accept");

  bzero(buffer,256);
  n = read(newsockfd,buffer,255);
  if (n < 0) error("ERROR reading from socket");
  printf("Here is the message: %s\n",buffer);
  n = write(newsockfd,"I got your message",18);

  if (n < 0) error("ERROR writing to socket");

  return 0;
}

Ein einfacher Client mit Sockets

#include <stdio.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <netdb.h>

void error(char *msg){ perror(msg);exit(0);}

int main(int argc, char *argv[]){
  int sockfd, portno, n;
  struct sockaddr_in serv_addr;
  struct hostent *server;
  char buffer[256];

  portno = atoi(argv[2]);

  sockfd = socket(AF_INET, SOCK_STREAM, 0);
  if (sockfd < 0)
    error("ERROR opening socket");

  ...
  ...

  server = gethostbyname(argv[1]);
  bzero((char *) &serv_addr, sizeof(serv_addr));
  serv_addr.sin_family = AF_INET;
  bcopy((char *)server->h_addr, (char *)&serv_addr.sin_addr.s_addr, server->h_length);
  serv_addr.sin_port = htons(portno);

  if (connect(sockfd,&serv_addr,sizeof(serv_addr)) < 0) error("ERROR connecting");

  printf("Please enter the message: ");
  bzero(buffer,256);
  fgets(buffer,255,stdin);
  n = write(sockfd,buffer,strlen(buffer));
  if (n < 0) error("ERROR writing to socket");
  bzero(buffer,256);
  n = read(sockfd,buffer,255);
  printf("%s\n",buffer);

  return 0;
}

Probleme bei der Verwendung von Sockets

Wir müssen uns kümmern um …

Middleware als Programmierabstraktion

  • Eine Softwareschicht oberhalb des Betriebssystems und unterhalb des Anwendungsprogramms, die eine gemeinsame Programmierabstraktion in einem verteilten System bietet.

  • Ein Baustein auf höherer Ebene als die vom Betriebssystem bereitgestellten APIs (z. B. Sockets)

images/middleware.svg

Middleware als Programmierabstraktion

Die von Middleware angebotenen Programmierabstraktionen verbergen einen Teil der Heterogenität und bewältigen einen Teil der Komplexität, mit der Programmierer einer verteilten Anwendung umgehen müssen:

Alte Middlewarestandards – wie zum Beispiel CORBA – waren sehr komplex und die Implementierungen verschiedener Hersteller meist nicht vollständig kompatibel.

Transparenzziele von Middleware aus Sicht der Programmierung

Middleware bietet (beim Programmieren) Transparenz in Bezug auf eine oder mehrere der folgenden Dimensionen:

Middleware ist die Software, die ein verteiltes System (DS) programmierbar macht.

Middleware als Infrastruktur

Seit Jahrzehnten kann beobachtet werden, dass Middleware immer komplexer wird bzw. wurde bis zu dem Punkt an dem die Komplexität kaum mehr beherrschbar war. Zu diesen Zeitpunkten wurden dann häufig neue Ansätze entwickelt, die die Komplexität reduzierten bis diese wiederum Eingang in komplexere Middleware-Produkten Eingang fand.

Ansätze, wie z. B. REST, haben sich als recht erfolgreich erwiesen stellen aber Entwickler vor neue Herausforderungen.

Middleware und nicht-funktionale Anforderungen

Die Infrastruktur kümmert sich um nicht-funktionale Eigenschaften, die normalerweise von Datenmodellen, Programmiermodellen und Programmiersprachen ignoriert werden:

Middleware als Infrastruktur

Middleware unterstützt zusätzliche Funktionen die die Entwicklung, Wartung und Überwachung einfacher und kostengünstiger machen (Auszug):

Konzeptionelle Darstellung (historischer) Middleware

images/historische-middleware-konzeptuell.svg

Insbesondere die explizite Erzeugung von Stubs und Skeletons durch einen IDL Compiler erfolgt so in der heutigen Zeit nicht mehr. Die Erzeugung von Stubs und Skeletons - wenn überhaupt erforderlich - erfolgt heute automatisch durch die Middleware.

Historische Entwicklung von Middleware

images/historic_middleware_technologies.svg

Entwicklung von Middleware

Middleware - High-level View

Eine Middleware stellt eine umfassende Plattform für die Entwicklung und den Betrieb komplexer verteilter Systeme zur Verfügung.

Middleware-Technologien

Remote Procedure Calls (RPCs)

Remote Procedure Call (RPC)

Schwerpunkt: verstecken der Netzkommunikation.

Ein Prozess kann eine Prozedur aufrufen deren Implementierung sich auf einem entfernten Rechner befindet:

RPCs konzeptionell (synchrone Kommunikation)

  • Ein Server ist ein Programm, das bestimmte Dienste implementiert.

  • Cients möchten diese Dienste in Anspruch nehmen:

    • Die Kommunikation erfolgt durch das Senden von Nachrichten (kein gemeinsamer Speicher, keine gemeinsamen Festplatten usw.)

    • Einige minimale Garantien müssen gegeben werden (Behandlung von Fehlern, Aufrufsemantik, usw.)

images/rpc_konzeptionell.svg

RPCs - zentrale Fragestellungen und Herausforderungen

Sollen entfernte Aufrufe transparent oder nicht transparent für den Entwickler sein?

Ein entfernter Aufruf ist etwas völlig anderes als ein lokaler Aufruf; sollte sich der Programmierer dessen bewusst sein?

Wie können Daten zwischen Maschinen ausgetauscht werden, die möglicherweise unterschiedliche Darstellungen für verschiedene Datentypen verwenden?

Komplexe Datentypen müssen linearisiert werden:

Marshalling:

der Prozess des Aufbereitens der Daten in eine für die Übermittlung in einer Nachricht geeignete Form.

Unmarshalling:

der Prozess der Wiederherstellung der Daten bei ihrer Ankunft am Zielort, um eine originalgetreue Repräsentation zu erhalten.

Wie findet und bindet man den Dienst, den man tatsächlich will, in einer potenziell großen Sammlung von Diensten und Servern?

Das Ziel ist, dass der Kunde nicht unbedingt wissen muss, wo sich der Server befindet oder sogar welcher Server den Dienst anbietet (Standorttransparenz).

Wie geht man mehr oder weniger elegant mit Fehlern um:

  • Server ist ausgefallen

  • Kommunikation ist gestört

  • Server beschäftigt

  • doppelte Anfragen ...

Je nach System ist die Reihenfolge der Bytes unterschiedlich:

High-level View auf RPC

Für Programmierer sieht ein entfernter Prozeduraufruf fast identisch aus wie ein lokaler Prozeduraufruf und funktioniert auch so - auf diese Weise wird Transparenz erreicht.

Um Transparenz zu erreichen, führte RPC viele Konzepte von Middleware-Systemen ein:

RPC - Call Semantics

Nehmen wir an, ein Client stellt eine RPC-Anfrage an einen Dienst eines bestimmten Servers. Nachdem die Zeitüberschreitung abgelaufen ist, beschließt der Client die Anfrage erneut zu senden. Das finale Verhalten hängt von der Semantik des Aufrufs (Call Semantics) ab:

Maybe (vielleicht; keine Garantie)

Die Zielmethode kann ausgeführt worden sein und die Antwortnachricht(en) ging(en) verloren oder die Methode wurde gar nicht erst ausgeführt da die Anfrage verloren ging.

XMLHTTPRequests in Webbrowsern verwenden diese Semantik.

At least once (mindestens einmal)

Die Prozedur wird ausgeführt werden solange der Server nicht endgültig versagt.

Es ist jedoch möglich, dass sie mehr als einmal ausgeführt wird wenn der Client die Anfrage nach einer Zeitüberschreitung erneut gesendet hatte.

At most once (höchstens einmal)

Die Prozedur wird entweder einmal oder gar nicht ausgeführt. Ein erneutes Senden der Anfrage führt nicht dazu, dass die Prozedur mehrmals ausgeführt wird.

Exactly once (genau einmal)

Das System garantiert die gleiche Semantik wie bei lokalen Aufrufen unter der Annahme, dass ein abgestürzter Server irgendwann wieder startet.

Verwaiste Aufrufe, d. h. Aufrufe auf abgestürzten Server-Rechnern, werden nachgehalten, damit sie später von einem neuen Server übernommen werden können.

Asynchrones RPC

Die Verbindung zwischen Client und Server in einem traditionellen RPC. Der Client wird blockiert und wartet.

images/rpcs/synchronous_rpc.svg

Die Verbindung zwischen Client und Server bei einem asynchronen RPC. Der Client wird nicht blockiert.

images/rpcs/asynchronous_rpc.svg

Ein normaler Aufruf mittels XMLHTTPRequest (JavaScript) ist auch immer asynchron.

RPC - Bewertung

Wenn man moderne Ansätze wie RESTful WebServices mit RPC vergleicht, dann fällt auf, dass RPC eine deutlich bessere Tranzparenz bietet.

Das Network File System (NFS) und SMB sind bekannte RPC-basierte Anwendungen.

Java Remote Method Invocation (RMI)

Java RMI (Remote Method Invocation)

Ermöglicht es einem Objekt, das in einer Java Virtual Machine (VM) läuft, Methoden eines Objekts aufzurufen, das in einer anderen Java VM läuft.

Java RMI vs. RPC

images/rpc_vs_rmi.svg

Java RMI ist eine spezielle Form von RPC, die in Java implementiert wurde. Der Unterschied ergibt sich im Prinzip aus dem Unterschied zwischen einem Prozeduraufruf und einem Methodenaufruf auf ein Objekt

Java RMI implementiert ein Distributed Object Model

images/java_rmi-distributed-object-model.svg

Anatomie eine Java RMI Aufrufs

images/rmi_anatomy/rmi_anatomy.svg

Der Proxy versteckt für den Client, dass es sich um einen entfernten Aufrufe handelt. Er implementiert die Remote-Schnittstelle und kümmert sich um das Marshalling und Unmarshalling der Parameter und des Ergebnisses.

Der Skeleton ist für die Entgegennahme der Nachrichten verantwortlich und leitet die Nachricht an das eigentliche Objekt weiter. Er sorgt für die Transparenz auf Serverseite.

Referenzen auf Remote Objects sind systemweit eindeutig und können frei zwischen Prozessen weitergegeben werden (z. B. als Parameter). Die Implementierung der entfernten Objektreferenzen wird von der Middleware verborgen (Opaque-Referenzen).

RMI Protocol Stack

images/rmi_anatomy/rmi_protocol_stack.svg

Einfacher RMI Dienst und Aufruf

Schnittstelle des Zeitservers

import java.rmi.Remote;
import java.rmi.RemoteException;
import java.util.Date;

public interface Time extends Remote {
  public Date getTime() throws RemoteException;
}

Implementierung der Schnittelle durch den Zeitserver

import java.rmi.RemoteException;
import java.rmi.server.UnicastRemoteObject;
import java.util.Date;

public class TimeServer extends UnicastRemoteObject implements Time {
  public TimeServer() throws RemoteException {
    super();
  }

  public Date getTime() {
    return new Date();
  }
}

Registrierung des Zeitservers

import java.rmi.Naming;

public class TimeRegistrar {

  /** @param args args[0] has to specify the hostname. */
  public static void main(String[] args) throws Exception {
    String host = args[0];
    TimeServer timeServer = new TimeServer();
    Naming.rebind("rmi://" + host + "/ServerTime", timeServer);
  }
}

Client des Zeitservers

import java.rmi.Naming;
import java.util.Date;

public class TimeClient {
  public static void main(String[] args) throws Exception {
    String host = args[0];
    Time timeServer = (Time) Naming.lookup("rmi://" + host + "/ServerTime");
    System.out.println("Time on " + host + " is " + timeServer.getTime());
  }
}

Java RMI - Tidbits

Klassische Web Services und SOAP

Integration von Unternehmensanwendungen

Die Probleme unternehmensübergreifende Punkt-zu-Punkt-Integration zu ermöglichen führten zur Entwicklung der nächsten Generation von Middleware-Technologien.

images/web_services-vs-message_brokers/message-brokers_and_adapters.svg

Jedes Unternehmen verwendet(e) seinen eigenen konkreten` Message-Broker - wenn wir mit mehreren Unternehmen kommunizieren wollen, müssen wir mehrere Adapter/Lösungen implementieren und pflegen.

Web Services

Webservices are self-contained, modular business applications that have open, internet-oriented, standards-based interfaces.

—UDDI Konsortium

Web Services - konzeptionell

images/web_services-vs-message_brokers/webservices_vision.svg

Web Services - wesentliche Bestandteile

images/web_services-vs-message_brokers/komponenten.svg

Web Services - Protokoll Stack

images/ws-protocol_stack.svg

SOAP

SOAP ist eine Weiterentwicklung von XML-RPC und stand ursprünglich für Simple Object Access Protocol.

SOAP (ab Version 1.2) ist ein Standard des W3C.

Aufbau einer SOAP-Nachricht

images/soap_message.svg

Nachrichten sind Umschläge, in die die Nutzdaten der Anwendung eingeschlossen werden.

Eine Nachricht hat zwei Hauptbestandteile:

Header (optional):

Für infrastrukturelle Daten wie Sicherheit oder Zuverlässigkeit vorgesehen.

Body (obligatorisch):

Für Daten auf Anwendungsebene vorgesehen. Jeder Teil kann in Blöcke unterteilt werden.

Beispiel einer SOAP-Nachricht

  <SOAP-ENV:Envelope
    xmlns:SOAP-ENV="http://schemas.xmlsoap.org/soap/envelope/"
    SOAP-ENV:encodingStyle="http://schemas.xmlsoap.org/soap/encoding/" />

  <SOAP-ENV:Header>
    <t:Transaction xmlns:t="ws-transactions-URI" SOAP-ENV:mustUnderstand="1">
      57539
    </t:Transaction>
  </SOAP-ENV:Header>

  <SOAP-ENV:Body>
    <m:GetLastTradePrice xmlns:m="Some-URI">
      <symbol>DEF</symbol>
    </m:GetLastTradePrice>
  </SOAP-ENV:Body>

  </SOAP-ENV:Envelope>

Beispiel eines SOAP-Aufrufs

POST /StockQuote HTTP/1.1
Host: www.stockquoteserver.com
Content-Type: text/xml; charset="utf-8"
Content-Length: nnnn
SOAPAction: "Some-URI"

<SOAP-ENV:Envelope
  xmlns:SOAP-ENV="http://schemas.xmlsoap.org/soap/envelope/"
  SOAP-ENV:encodingStyle="http://schemas.xmlsoap.org/soap/encoding/">

  <SOAP-ENV:Body>
    <m:GetLastTradePrice xmlns:m="Some-URI">
      <symbol>DIS</symbol>
    </m:GetLastTradePrice>
  </SOAP-ENV:Body>

</SOAP-ENV:Envelope>

Beispiel einer SOAP-Antwort

  HTTP/1.1 200 OK
  Content-Type: text/xml; charset="utf-8"
  Content-Length: nnnn

  <SOAP-ENV:Envelope
    xmlns:SOAP-ENV="http://schemas.xmlsoap.org/soap/envelope/"
    SOAP-ENV:encodingStyle="http://schemas.xmlsoap.org/soap/encoding/" />

  <SOAP-ENV:Body>
    <m:GetLastTradePriceResponse xmlns:m="Some-URI">
      <Price>34.5</Price>
    </m:GetLastTradePriceResponse>
  </SOAP-ENV:Body>

  </SOAP-ENV:Envelope>

Web Services - Standardisierung

screenshots/ws_standards.png
screenshots/ws_standards_w3c.png

Überblick

images/genealogy-of-middleware.svg

Messaging and Message-oriented Communication/Middleware

ZeroMQ

Sollte zum Beispiel der Server in Java und der Client in C geschrieben sein, dann ist ggf. das Verständnis darüber wie ein String übertragen wird unterschiedlich (z. B. mit null terminiert oder mit einer Länge versehen).

ZeroMQ - Messaging Patterns

images/zeromq/client-server.svg
images/zeromq/pub-sub.svg
images/zeromq/pipeline.svg
Client-Server:

Ermöglicht die übliche Kommunikation zwischen einem Client und einem Server. Allerdings findet ggf. eine Pufferung statt, wenn der Server nicht erreichbar ist.

Publish-Subscribe:

Ermöglicht es den Clients, sich für ein bestimmtes Thema zu registrieren und dann alle Nachrichten zu erhalten, die zu diesem Thema veröffentlicht werden. Ein Nachricht mit einem bestimmten Thema wird an alle dafür registrierten Clients gesendet.

Pipeline:

Ermöglicht die Versendung einer Aufgabe an genau einen beliebigen Worker aus einer Menge von (homogenen) Workern.

ZeroMQ - Beispiel Publish-Subscribe

import static java.lang.Thread.currentThread
import org.zeromq.SocketType;
import org.zeromq.ZMQ;
import org.zeromq.ZContext;

public class Publisher {
  public static void main(String[] args)
      throws Exception {
    try (ZContext context = new ZContext()) {
      ZMQ.Socket publisher =
          context.createSocket(SocketType.PUB);
      publisher.bind("tcp://*:5556");
      publisher.bind("ipc://" + <endpoint>);

      while (!currentThread().isInterrupted()) {
        int zipcode = <some zipcode>
        //  Send to all subscribers
        String update = String.format("%05d %s",
            zipcode, <some msg>);
        publisher.send(update, 0);
      }
} } }
import java.util.StringTokenizer;

import org.zeromq.SocketType;
import org.zeromq.ZMQ;
import org.zeromq.ZContext;

public class Subscriber{
  public static void main(String[] args) {
    try (ZContext context = new ZContext()) {
      ZMQ.Socket subscriber =
          context.createSocket(SocketType.SUB);
      subscriber.connect("tcp://localhost:5556");
      subscriber.subscribe(
          <zipcode(Str)>.getBytes(ZMQ.CHARSET));
      while(true) {
        String string = subscriber.recvStr(0);
        // e.g. take string apart:
        //   part1: zipcode
        //   part2: message
        System.out.println(string);
      }
} } }

MOM - Message Oriented Middleware

MOM - Grundlegendes Interface

Operation

Beschreibung

PUT

Legt eine Nachricht in eine bestimmte Warteschlange.

GET

Blockiert an einer bestimmten Warteschlange bis eine Nachricht verfügbar ist. Entfernt die erste Nachricht.

POLL

Prüft, ob eine Nachricht in einer bestimmten Warteschlange verfügbar ist. Entfernt ggf. die erste Nachricht. POLL blockiert niemals

NOTIFY

Registriert einen Handler (Callback) der aufgerufen wird, wenn eine Nachricht einer bestimmten Warteschlange hinzugefügt wird.

MOM - Queue Managers

images/message-queueing.svg

Queue Managers sind der zentrale Baustein von Message-queueing Systemen. Im Allgemeinen gibt es (mindestens konzeptionell) einen lokalen Queue Manager pro Prozess. Ein Queue Manager ist ein Prozess, der Nachrichten in Warteschlangen speichert und verwaltet. Bei Bedarf kann er mehrere Warteschlangen verwalten und an andere Queue Manager weiterleiten.

Übung

Asynchrone, verbindungsorientierte Kommunikation

Entwickeln Sie einen Client für einen Logging Server, der Lognachrichten an den Server sendet. Im Fehlerfall, z. B. wenn der Server nicht verfügbar ist oder es zu einer Netzwerkpartitionierung kam, sollen die Nachrichten zwischengepuffert werden und bei Serververfügbarkeit wieder zugestellt werden. Mit anderen Worten: Im Fehlerfall soll der Client nicht blockieren, sondern weiter funktionieren. Der Client stellt stattdessen die Nachrichten dann zu, wenn der Server wieder verfügbar wird.

Stellen Sie sicher, dass Nachrichten immer in der richtigen Reihenfolge am Server ankommen. D. h. stellen Sie zum Beispiel sicher, dass eine gepufferte Nachricht nie nach einer neueren Nachricht ankommt.

Verwenden Sie den Code im Anhang als Schablone.

MTAwMDAw:f4UIQXz00AbXZPPZSa7Fo/e8DF7qu/CQRId7Hf+rw0E=:XQgyth/JQbnZRj2O:

Einfacher TCP basierter SyslogServer

import java.net.*;
import java.io.*;

public class SyslogServer {
  public static void main(String[] args) {
    BufferedReader in = null;
    try {
      ServerSocket server = new ServerSocket(9999);
      while (true) {
        try (Socket con = server.accept()) {
            in = new BufferedReader(
                new InputStreamReader(con.getInputStream()));
            System.out.println("[Logging] " + in.readLine());
        } catch (IOException e) {
            System.err.println(e);
        }
      }
    } catch (IOException e) {
        System.err.println(e);
    }
  }
}

Schablone für den Client

import java.net.*;
import java.io.*;

public class Client {

  /**
  * Versendet die Nachricht an den Server (wenn möglich).
  */
  private static void sendMsg(String msg) throws IOException{
    try (Socket s = new Socket("localhost", 9999)) {
      BufferedReader networkIn =
          new BufferedReader(
              new InputStreamReader(s.getInputStream()));
      PrintWriter networkOut =
          new PrintWriter(s.getOutputStream());
      networkOut.println(msg);
      networkOut.flush();
    }
  }

  > Datenstruktur zum Zwischenspeichern der
  > bisher nicht erfolgreich versendeten Nachrichten!

  public static void log(String msg) {
      > Schicke Nachricht an den Server (wenn möglich).
      > Blockiert nicht, wenn der Server nicht verfügbar ist.
  }

  public static void startThread() throws Exception {
      Thread.ofVirtual().start(() -> {
          while (true) {
              try {
                // Alle 5 Sekunden prüfen wir ob wir noch
                // nicht versendete Nachrichten haben:
                Thread.sleep(5000);
              } catch (InterruptedException e) { }
              > Versende Nachrichten,
              > die noch nicht versendet wurden
          }
      });
  }

  public static void main(String[] args) throws Exception {
      startThread();
      BufferedReader userIn =
          new BufferedReader(
              new InputStreamReader(System.in));
      while (true) {
          String theLine = userIn.readLine();
          if (theLine == null)
              break;
          log(theLine);
      }
  }
}