Objektrahmen
Siehe Seitengeometrierahmen
OBA-Wert (Optische Aufheller)
Optische Aufheller sind chemische Substanzen, welche häufig für Fotopapiere verwendet werden, um das Papier »weißer« aussehen zu lassen. Dieser Wert ist ein Indikator, welcher verwendet wird, um die Verschiebung der Grauachse eines Farbprofils zu kompensieren. Der OBA-Wert kann wie folgt berechnet werden:
- Messung des Papiers mit M1
- Messung des Papiers mit M2
- Differenz des b-Werts von M2-M1
Die OBA-Werte können folgendermaßen interpretiert werden:
- OBA-Wert = 0: kein optischer Aufheller
- OBA-Wert = 0-4: Wenig optische Aufheller
- OBA-Wert = 4-6: Mittlere optische Aufheller
- OBA-Wert > 6: Viel optische Aufheller
OCR
Der Begriff OCR steht für Optical Character Recognition, zu Deutsch also optische Zeichenerkennung. Dabei handelt es sich um eine Technologie, wodurch die automatische Texterkennung von Buchstaben, Wörtern und Zahlen in Bilddateien möglich wird. Die Buchstaben, Wörter oder Zahlen der Datei werden erfasst und in bearbeitbare und durchsuchbare Texte umgewandelt.
Grundlegend baut die Technologie hinter OCR auf dem Prinzip der Mustererkennung (Pattern Recognition) auf. Dabei werden Buchstaben, Ziffer und Satzzeichen mit einer Datenbank abgeglichen und so als Text bzw. Textzeichen erkannt und zu einem Wort bzw. zu ganzen Sätzen zusammengefasst. Früher wurden zur automatischen Texterkennung noch eigene Schriftarten verwendet, die vom OCR-Lesegerät schnell und zuverlässig erkannt wurden. Bei moderenen OCR-Verfahren kommen vor allem Algorithmen und Künstliche Intelligenz (KI) dafür zum Einsatz.
Moderne OCR-Verfahren lassen sich dabei grundsätzlich in fünf Schritte unterteilen:
- Layoutanalyse – Damit einzelne Schriftzeichen überhaupt sichtbar werden, muss die Datei zuerst in ein Schwarz-Weiß-Bild umgewandelt werden. Dadurch wird der Text bestmöglich vom Hintergrund abgehoben. So werden auch Layoutelemente wie Überschrift, Absätze oder auch Tabellen identifiziert.
- Segmentierung – Als nächster Schritt müssen die einzelnen Buchstaben von den grafischen Elementen der Datei unterschieden werden. Dabei wird Zeile für Zeile jede Textpassagen identifiziert.
- Zeichenerkennung – Jetzt kommt die Mustererkennung zum Einsatz. Jedes zuvor gefundene Zeichen wird jetzt mit der Datenbank abgeglichen. Dabei helfen Merkmale wie Höhe, Breite oder allgemein die Struktur des Zeichens. So werden alle Zeichen in Buchstaben, Wörter und Zahlen verwandelt.
- Nachbearbeitung – Neuere OCR-Verfahren führen heutzutage auch gleich eine Art Autokorrektur durch. Hier wird mithilfe von Künstlicher Intelligenz die Genauigkeit der Zeichenerkennung verbessert.
- Codierung – Im letzen Schritt wird das Endergebnis in ein neues Dateiformat überführt und kann so für den Anwender be- bzw. weiterverarbeitet werden.
Optimierte Speicherung
Bei der optimierten Speicherung spricht man von einer linearen Speicherung, wodurch alle inkrementellen Anhänge in der Dateistruktur eingearbeitet werden und somit die Datei wiederum in der kleinstmöglichen Dateigröße abgespeichert wird.
Abbildung 1: Gegenüberstellung der Dateistruktur einer PDF-Datei inkrementell (links) und linear (rechts)
Der Vorteil der optimierten Speicherung liegt in der kleinstmöglichen Dateigröße des Dokuments. Der Nachteil einer optimierten Speicherung liegt in der Verarbeitungszeit. Der Speichervorgang dauert einfach etwas länger.
Optimiertes Speichern von Dokumenten
Durch den Aufruf des Speichern unter… Befehls in Anwendungen, wird in der Regel das Dokument immer optimiert gespeichert. In manchen grafischen Anwendungen, wie z.B: im PixFile | PDF-Editor stehen eigene Menübefehle zum optimierten Speichern von aktuell geöffneten Dokumenten zur Verfügung.
Optional Content Groups (OCG's)
PDF kennt kein Ebenenkonstrukt, wie es in Grafikapplikationen wie etwa Adobe InDesign, Adobe Illustrator oder Adobe Photoshop aufgebaut ist. Ebenen werden in PDF als Optional Content Groups (OCG's) bezeichnet. Wie aus der Bezeichnung hervorgeht, wurden OCG's in PDF initial dafür konzipiert, Inhalt optional sichtbar oder unsichtbar zu machen. Die folgende Tabelle soll unterschiede zwischen den beiden erläutern:
Tabelle 1: Ebenen versus OCG's
Hierachische Ebenen | Optional Content Groups |
---|---|
Es muss zumindest eine Ebene vorhanden sein auf der alle Objekte liegen. | OCG’s sind nicht erforderlich. Als Container für alle Objekte dient das PDF selbst. |
Ebenen sind für das gesamte Dokument definiert. Das heißt, jede Seite oder Zeichenfläche greift auf die selben Ebenen, Ebenennamen und Ebenenhierarchie zurück. | OCG’s können von Seite zu Seite varieren, da sie für jede Seite definiert sind. |
Eine hierachiesche Ebene dient als Container. Jedes Objekt, welches darauf plaziert wird, muss auf einer Ebene liegen und einzelne Objekte können nicht auf mehreren Ebenen liegen. | Einzelne Objekte können auf keiner, einer oder mehreren OCG's liegen. Das rührt daher, dass die OCG vielmehr ein Attribut des Objektes selbst, als ein übergeordneter Container ist. |
Ebenen sind hierarchisch. Objekte einer höher liegenden Ebene verdecken Objekte der darunter liegenden Ebene. | Die Hierarchie in einer OCG wird separat gehandhabt und nicht der gesamte OCG-Container hierarchisch angeordnet. Somit können PDF-Objekte die im Vordergrund aber auch im Hintergrund im PDF angeordnet sind, nicht mehr sichtbar sein, wenn eine Ebene ausgeblendet wird. |
Möglicher OCG Status
Im PDF können OCG's unterschiedlichen Stati besitzen. Zu den gängigsten Stati zählen folgende:
- Gesperrt / Frei zugänglich – Objekte der OCG's können somit vor Zugriff geschützt werden
- Sichtbar / Nicht sichtbar – Objekte der OCG's können somit aus- bzw. eingeblendet werden.
-
Sichtbar – die Sichtbarkeit einer OCG kann folgende Eigenschaften besitzen:
- ist nur dann sichtbar, wenn die Ebene aktiviert ist
- ist immer sichtbar, selbst wenn die Ebene ausgeblendet ist
- ist nie sichtbar, obwohl die Ebene eingeblendet ist
-
Druckbar – die Druckbarkeit einer OCG kann folgende Eigenschaften besitzen:
- kann nur dann gedruckt werden, wenn diese sichtbar ist
- kann immer gedruckt werden, selbst wenn die Ebene nicht sichtbar ist
- kann nie gedruckt werden, obwohl die Ebene sichtbar ist
-
Exportierbarkeit – die Exportierbarkeit einer OCG kann folgende Eigenschaften besitzen:
- kann nur dann exportiert werden, wenn diese sichtbar ist
- kann immer exportiert werden, selbst wenn die Ebene nicht sichtbar ist
- kann nie exportiert werden, obwohl die Ebene sichtbar ist
Output Intent
Siehe Ausgabebedingung