Dokumentenmanagement, Archivierungs- und Verschlüsselungsverfahren

Dozent:

Prof. Dr. Michael Eichberg

Kontakt:

michael.eichberg@dhbw-mannheim.de, Raum 149B

Version:

2024-05-09

Folien:
HTML:

https://delors.github.io/dm-einfuehrung/folien.rst.html

PDF:

https://delors.github.io/dm-einfuehrung/folien.rst.html.pdf

Fehler auf Folien melden:

https://github.com/Delors/delors.github.io/issues

Dokumentmanagement, Archivierungs- und Verschlüsselungsverfahren - W3WI_EH304.1

Verortung:

Drittes Studienjahr (5. oder 6. Semester)

Umfang:

25 Vorlesungsstunden und 50 Stunden Selbststudium (2,5 ECTS)

Übergeordnetes Modul:

Fortgeschrittene Konzepte des Informationsmanagements im Gesundheitswesen (W3WI_EH304)

Prüfungsleistung:

Klausur (60 min/60 Punkte) oder

Portfolio (hier mündl. Prüfungsgespräche mit 10min pro Person.)

Kerninhalte gem. MHB

Literatur

Warum Dokumentenmanagement?

Motivation

Zum Beispiel fallen für ein einzelnes konventionelles Kraftwerk bereits ca. 500  000 Dokumente.

Digitalisierung - ein langwieriger Prozess...

images/floppydisk.com.2024-01.png

Jan. 2024

Digitalisierung - ein langwieriger nicht-aufzuhaltender Prozess...

Japanese government finally bids sayonara to the 3.5" floppy disk

Businesses can at long last submit digital docs to government agencies

Japan is saying sayonara to the floppy disk, which until now was a required medium for submitting some 1,900 official documents to the government.

The announcement (Japanese, machine translated) last week from the Ministry of Economy, Trade and Industry brings decades of physical media submission requirements in Japan to an end. [...]

Despite being a world leader in cutting-edge technology, Japan has an odd relationship with legacy tech. It's still a land of cash-only payments and fax machines that has moved slowly to embrace the modern digital economy.

—The Register, Mon 29 Jan 2024 // 19:00 UTC

Digitalisierung - ein Prozess mit Stilblüten...

images/sparkasse-verschickt-usb-sticks.2024-03-03.png

Wie die zahlreichste Bibliothek, wenn ungeordnet, nicht so viel Nutzen schafft, als eine sehr mäßige, sorgfältig geordnete; eben so ist die größte Menge von Kenntnissen, die nicht gehörig durch eigenes Denken bearbeitet werden, viel weniger Wert als eine viel geringere Menge von Kenntnissen, die gehörig durchdacht werden.

—Arthur Schopenhauer (mutmaßlich)

Was kann ein Dokumentenmanagement System (DMS) leisten?

Revisionssichere Archivsysteme stellen sicher, dass Informationen wieder auffindbar, nachvollziehbar, unveränderbar und verfälschungssicher archiviert sind.

Gegenüberstellung konventionelles Archiv zu DMS

Konventionell

DMS

Ablagestruktur

hierarchisch, meist nach Dokumententypen getrennt

datenbankgestützt, Suchbeginn nach jedem Suchkriterium möglich, Suche wahlweise z. B. je Kunde, Vorgang oder Beleg

Auskunftsbereitschaft

zeitverzögert, nach Sichtung/ Entnahme aller Dokumente

unmittelbar durch vorgangsbezogene bzw. dokumentenübergreifende Suche

Auskunftsaufwand

für Belegsuche, Entnahme und wieder einordnen, evtl. kopieren und Versand

nur für Recherche am Bildschirm, gegebenenfalls direkter Versand per E-Mail

Redundanz

Abteilungsablagen = mehrfacher Aufwand

Einmalablage

Vollständigkeit

leidet unter jeder Entnahme

bleibt immer gewahrt

Sicherheit

Ordner u. Dokumente lassen sich leicht entfernen oder kopieren

klare Regelung der Zugriffsrechte, keine ungewollte Entnahme möglich

Zyklus von Dokumenten

drawings/dokumente/lebenszyklus.svg

Grundlegende Voraussetzungen für Dokumentenmanagementorganisation

In einer Organisation ist zu regeln:

Ein Dokumentenmanagementsystem ist ein IT System zur Unterstützung der Dokumentenmanagementorganisation.

Dokument und Dokumentenmanagement

Dokumente - Beispiele

drawings/dokumente/dokumente.svg

Was ist ein Dokument aus logischer Sicht?

Das Dokument ist somit eigentlich der Träger, der die Informationen speichert, unabhängig davon ob das Dokument ein Stück Papier, eine Datei auf einem Rechner, ein Videoband oder eine Tontafel ist etc.

Was ist ein Dokument aus technischer Sicht?

Es ist somit eine reine Deklarationsfrage, was ein Dokument ist!

Elektronische Dokumente

drawings/dokumente/elektronische_dokumente.svg
NCI:

Non-Coded-Information (NCI)-Dokumente sind eingescannte Unterlagen, die als Bild vorliegen, also keine direkte Bearbeitung/Verarbeitung ermöglichen.

CI:

Ein CI-Dokument ist ein digital erstelltes Dokument, das durch Zeichensätze kodiert ist und von Programmen direkt ausgewertet werden kann.

OCR (Optical Character Recognition):

Text einer gedruckten Vorlage wird durch einfachen Mustervergleich automatisch in maschinenlesbare Zeichen transformiert.

ICR (Intelligent Character Recognition):

Die Qualität der Texterkennung wird durch Kontextanalyse verbessert. Typische Fehler von OCR-Systemen, wie zum Beispiel Fehlerkennungen von optisch nahe beieinanderliegenden Zeichen (z. B. „8 und B“ oder „0 und O“), werden vermieden. (Wie nahe Zeichen beieinander liegen, ist stark vom verwendeten Schrifttyp abhängig.)

OMR (Optical Mark Recognition):

Liest mit großer Sicherheit spezielle Markierungen in vordefinierten Feldern aus - zum Beispiel in Multiple-Choice-Tests und Vordrucken.

Bestandteile eines Dokumentes

images/eheurkunde.png
drawings/dokumente/mit_stempel.svg

Struktur eines Dokumentes

images/berufung.png
drawings/dokumente/struktur.svg

Dokumente annotieren

images/dokument_mit_anmerkungen.png

Renditions eines Dokumentes

Hashwerte und Signaturen [1]

Volltext(-indizierung)

Versionierung von Dokumenten

Meta-Daten

Dies ist insbesondere ein Thema der Datenmodellierung, d. h. welche Daten möchte man wie erfassen.

Arten von Meta-Daten

Beispiele von Meta-Daten einer Verwaltungssoftware für grafische Zeichnungen

Nr.

Attribut

Muss

Funktion

Quelle

Bemerkung

1

Zeichnungsnummer

M

Eindeutiger Schlüssel

Manuelle Vergabe durch Benutzer

Identifiziert Zeichnung

2

Zeichnungsmappen- nummer

M

Fremdschlüssel

3a

Version

M

Version der Zeichnung verwalten

Automatische Vergabe durch DMS bei Check-in

Benutzer entscheidet

ob minor oder major

3b

Check-In-Datum

M

Datum des Check-in der Version

Automatische Vergabe durch DMS

Check-in Datum

3c

Dokumenten-Owner

M

Gruppe aus letzten Bearbeitern

Aus USER-ID abgeleitet

3d

Letzter Bearbeiter

M

Identifikation

USER-ID

Beim Check-in

Zusammenfassung: Dokumente in einem DMS

Ein Dokument in einem DMS ist ein komplexes Objekt, das aus verschiedenen Komponenten bestehen kann:

Dokumentenstrukturen

Ein Beispiel einer Mappe wäre eine Vorgangsakte mit einem Antrag, (am Ende) einem Gutachten, ggf. E-Mails aber auch handschriftlichen Notizen ...

Zusammengesetzte Dokumente

Komplexes Objekt aus mehreren Dokumenten mit eigener Verwaltungsstruktur:

Zusammengesetzte Dokumente ≘ Compound Documents

Dokumentenlebenszyklus

Dokumentenlebenszyklus - Überblick

drawings/dokumente/lebenszyklus_a_bis_z.svg

Dokumentenlebenszyklus

Dokumente ...

Erstellen von Dokumenten

Nutzen und Bearbeiten von Dokumenten

Rahmenbedingungen für die Lebensdauer von Dokumenten

Löschen von Dokumenten

Archivierung (von Dokumenten)

Kerneigenschaften elektronischer Archive

Archiv System müssen die folgenden Eigenschaften bei langjähriger Aufbewahrung unterstützen:

Integrität:

Nachweis, dass die Informationen während der Aufbewahrung nicht verändert oder gelöscht wurden.

Authenzität:

Herkunft lässt sich zweifelsfrei nachweisen.

Lesbarkeit:

Informationen müssen auch in Zukunft lesbar sein.

Eigenschaften wie die Unterstützung von Volltextindizierung sind nicht in allen Fällen notwendig.

Z. B. muss ein Insolvenzverwalter nach dem Abschluss des Verfahrens die Dokumente 10 Jahre aufbewahren obwohl er in dieser Zeit die Dokumente höchstwahrscheinlich nicht mehr benötigt.

Informationen über die Ergebnisse von arbeitsmedizinischen Untersuchungen (dies sind ggf. sehr vielfältige und umfangreiche Daten (z. B. Röntenbilder, EKGs)) müssen 30 Jahre bis nach der letzten Untersuchung aufbewahrt werden, da sich daraus ggf. Rentenansprüche ableiten. Daraus leiten sich ggf. Fristen für Dokumente von 50 Jahren und mehr ab.

Revisionssichere elektronische Archivierung

Merkmale revisionssicherer Archivsysteme sind:

  • Informationen sind wieder auffindbar,

  • Änderungen sind nachvollziehbar,

  • Informationen sind unveränderbar und

  • die Informationen sind verfälschungssicher archiviert

Aufgrund von HGB-Vorschriften gilt für die Revisionssicherheit bei der Archivierung:

  • Richtigkeit

  • Vollständigkeit

  • Sicherheit des Gesamtverfahrens

  • Schutz vor Veränderung und Verfälschung

  • Sicherung vor Verlust

  • Nutzung nur durch Berechtigte

  • Einhaltung der Aufbewahrungsfristen

  • Dokumentation des Verfahrens

  • Nachvollziehbarkeit

  • Prüfbarkeit

Strategien für die langfristige Aufbewahrung von Dokumenten

Bewertung von Dateiformaten in Hinblick auf die Dauerhaftigkeit

Langfristige Aufbewahrung von Dokumenten

Content Type

High probability for long-term preservation

Medium probability for long-term preservation

Low probability for long-term preservation

Text

  • Plain text (encoding: USASCII, UTF-8, UTF-16 with BOM)

  • XML (includes XSD/XSL/XHTML, etc.; with included or accessible schema)

  • PDF/A-1 (ISO 19005-1) (*.pdf)

  • Cascading Style Sheets (*.css)

  • DTD (*.dtd)

  • Plain text (ISO 8859-1 encoding)

  • PDF (*.pdf) (embedded fonts)

  • Rich Text Format (*.rtf)

  • HTML (include a DOCTYPE declaration)

  • SGML (*.sgml)

  • Open Office (*.sxw/*.odt)

  • OOXML (ISO/IEC DIS 29500) (*.docx)

  • PDF (*.pdf) (encrypted)

  • Microsoft Word (*.doc)

  • WordPerfect (*.wpd)

  • All other text formats not listed here

Content Type

High probability for long-term preservation

Medium probability for long-term preservation

Low probability for long-term preservation

Raster Image

  • TIFF (uncompressed)

  • JPEG2000 (lossless) (*.jp2)

  • PNG (*.png)

  • BMP (*.bmp)

  • JPEG/JFIF (*.jpg)

  • JPEG2000 (lossy) (*.jp2)

  • TIFF (compressed)

  • GIF (*.gif)

  • Digital Negative DNG (*.dng)

  • MrSID (*.sid)

  • TIFF (in Planar format)

  • FlashPix (*.fpx)

  • PhotoShop (*.psd)

  • RAW

  • JPEG 2000 Part 2 (*.jpf, *.jpx)

  • All other raster image formats not listed here

Content Type

High probability for long-term preservation

Medium probability for long-term preservation

Low probability for long-term preservation

Vector Graphics

  • SVG (no Java script binding) (*.svg)

  • Computer Graphic Metafile (CGM, WebCGM) (*.cgm)

  • Encapsulated Postscript (EPS)

  • Macromedia Flash (*.swf)

  • All other vector image formats not listed here

Content Type

High probability for long-term preservation

Medium probability for long-term preservation

Low probability for long-term preservation

Audio

  • AIFF (PCM) (*.aif, *.aiff)

  • WAV (PCM) (*.wav)

  • SUN Audio (uncompressed) (*.au)

  • Standard MIDI (*.mid, *.midi)

  • Ogg Vorbis (*.ogg)

  • Free Lossless Audio Codec (*.flac)

  • Advance Audio Coding (*.mp4, *.m4a, *.aac)

  • MP3 (MPEG-1/2, Layer 3) (*.mp3)

  • AIFC (compressed) (*.aifc)

  • NeXT SND (*.snd)

  • RealNetworks 'Real Audio' (*.ra, *.rm, *.ram)

  • Windows Media Audio (*.wma)

  • Protected AAC (*.m4p)

  • WAV (compressed) (*.wav)

  • All other audio formats not listed here

Content Type

High probability for long-term preservation

Medium probability for long-term preservation

Low probability for long-term preservation

Video

  • Motion JPEG 2000 (ISO/IEC 15444-4)(*.mj2)

  • AVI (uncompressed, motion JPEG) (*.avi)

  • QuickTime Movie (uncompressed, motion JPEG) (*.mov)

  • Ogg Theora (*.ogg)

  • MPEG-1, MPEG-2 (*.mpg, *.mpeg, wrapped in AVI, MOV)

  • MPEG-4 (H.263, H.264) (*.mp4, wrapped in AVI, MOV)

  • AVI (others) (*.avi)

  • QuickTime Movie (others) (*.mov)

  • RealNetworks 'Real Video' (*.rv)

  • Windows Media Video (*.wmv)

  • All other video formats not listed here

Content Type

High probability for long-term preservation

Medium probability for long-term preservation

Low probability for long-term preservation

Spreadsheet/ Database

  • Comma Separated Values (*.csv)

  • Delimited Text (*.txt)

  • SQL DDL

  • DBF (*.dbf)

  • OpenOffice (*.sxc/*.ods)

  • OOXML (ISO/IEC DIS 29500) (*.xlsx)

  • Excel (*.xls)

  • All other spreadsheet/ database formats not listed here

Content Type

High probability for long-term preservation

Medium probability for long-term preservation

Low probability for long-term preservation

Virtual Reality

  • X3D (*.x3d)

  • VRML (*.wrl, *.vrml)

  • U3D (Universal 3D file format)

  • All other virtual reality formats not listed here

Content Type

High probability for long-term preservation

Medium probability for long-term preservation

Low probability for long-term preservation

Computer Programs

  • Computer program source code, uncompiled (*.c, *.c++, *.java, *.js, *.jsp, *.php, *.pl, etc.)

  • Compiled / Executable files (EXE, *.class, COM, DLL, BIN, DRV, OVL, SYS, PIF)

Content Type

High probability for long-term preservation

Medium probability for long-term preservation

Low probability for long-term preservation

Presentation

  • OpenOffice (*.sxi/*.odp)

  • OOXML (ISO/IEC DIS 29500) (*.pptx)

  • PowerPoint (*.ppt)

  • All other presentation formats not listed here

Recommended File Formats for Long-Term Data Curation - Georgia Southern University | University Libraries

Dateiformate und ihre Eignung für die Langzeitarchivierung

SPASSPROJEKT: Entwicklerin erstellt PDF-Dokument in der Größe der Welt

Sind PDFs in ihren Ausmaßen in der Größe limitiert? Eine Frau wollte es genau wissen und erstellte ein Dokument, das größer ist als Deutschland.

PDF-Enthusiastin Alex Chan hat ein Experiment durchgeführt, um ein extrem großes PDF-Dokument zu erstellen – lediglich, um zu sehen, ob es möglich ist. Mit ihrem Wissen über das PDF-Dateiformat machte sich Chan daran, ein PDF-Dokument zu erstellen, das größer ist als die Bundesrepublik Deutschland. [...]

Sie lädt andere Dateiformat-Enthusiasten ein, mit ihr die Möglichkeiten jenseits der dokumentierten Spezifikationen zu erforschen.

Andreas Donath 3. Februar 2024, 14:21 Uhr

E-Mail-Archivierung - eine besondere Herausforderung

Geschäftliche E-Mails sind Dokumente und müssen mit der gleichen Sorgfalt (revisionssicher) archiviert werden wie andere Dokumente.

Herausforderungen:

Aufgrund rechtlicher Rahmenbedingungen wird im Allgemeinen die zentrale Archivierung von E-Mails bevorzugt.

Pflege des Systems

Regelmäßiges Umkopieren der Bestände ist häufig notwendig:

Sichere Speicherung

Die Frage ob die Metadaten oder Dokumente zentral oder dezentral gespeichert werden, stellt sich insbesondere bei Behörden und großen Unternehmen, die über mehrere Standorte verfügen.

Sichere Speicherung kann nicht lokal erfolgen

Drucken von Dokumenten

DM-Systeme müssen das Drucken von Dokumenten unterstützen, da Nutzer oft Ausdrucke benötigen (z. B. auf Baustellen)

Relevante Anforderungen an den Ausdruck:

Integration

DMS als Infrastruktur

Typische (Web-) Dienste eines DMS

  • Create document

  • Move document

  • Copy document

  • Delete document

  • Search document

  • Search full text

  • Retrieve full document info

  • ...

  • Create folder

  • Move folder

  • Copy folder

  • Delete folder

  • Search folder

  • ...

Beispiel: Anlagendokumentation

drawings/dokumente/anlagendokumentation.svg

Redlining bzw. die Redlining-Funktion, oder auch Rotstiftfunktion, bezeichnet das Markieren und Ändern von elektronischen Dokumenten oder Zeichnungen zu Feedback-Zwecken. Anmerkungen und Änderungen sind ersichtlich, ohne dass die Originaldatei verändert wird.

(Vgl. https://www.fme.de/blog/redlining-spezielle-anwendungsfaelle-auf-basis-von-opentext-documentum-for-life-sciences-teil-5/)

Beispiel: Anlagendokumentation

Typische Fragestellungen bei Integration

Zusammenfassung: Dokumenten-Management-Lösung

drawings/dokumente/dokumenten-management-loesung.svg

Produkte

Kategorisierung von DMS Produkten

Enterprise Content Management (ECM)

Beim Records-Management (Schriftgutverwaltung) ist die Betrachtung des gesamten Lebenszyklus von Akten in Hinblick auf einen sachlichen Kontext bzw. Geschäftsvorfall (Transaktion) und die Dokumentation desselbigen im Fokus.

Records-Management erstreckt sich ggf. auch auf Papierdokumente.

Records-Management bedingen den Einsatz von DMS und Workflow-Systemen.

Enterprise Content Management (ECM) im AIIM Modell[2]

drawings/ecm.svg

Open-Source Lösungen (Stand 2024)

Open-Source Lösungen bieten meist grundlegende Funktionalität

Für bitfarm-Archiv Enterprise sind zumindest die Serverinstallation und eine Schulung des / der IT-Betreuer durch uns oder einen unserer Dokumentenmagementsystem Partner notwendig. So können wir dafür garantieren, dass das System funktioniert und den technischen Teil der zum Nachweis der Revisionssicherheit erforderlichen Verfahrensdokumentation übernehmen.

Gerade in kleineren Unternehmen mit übersichtlichen Anforderungen und knapper Kostenkalkulation kann das DMS anschließend in Eigenleistung konfiguriert werden. Tauchen dabei Fragen oder Probleme auf, stehen Ihnen unsere Supportmitarbeiter zur Seite. [...]Inklusive professionellem Support für ein Jahr sowie Installation, aller Module & Plugins, ist die Enterprise Version schon ab etwa 2500,- € erhältlich.