PhD thesis


AuthorJens-Rainer Ohm
TitleFestbildcodierung bei niedrigen Bitraten unter Verwendung kombinierter Block- und Faltungscodes
Date1989
TutorProf. Noll
AbstractIn der vorliegenden Arbeit wurde eine Klasse neuartiger Codierverfahren für Festbildsignale untersucht, die auf einer Kombination des Verfahrens der prädiktiven Codierung mit den Methoden sowohl der Block- als auch der Faltungscodierung beruhen. Auf diese Weise war es möglich, die in der Codierungstherorie geforderten großen Codewortlängen zu erreichen, und trotzdem ein Codierverfahren mit realisierbarer Komplexität zu erhalten. Die wichtigsten Ergebnisse sollen kurz zusammengefaßt werden:
1. Durch eine neuartige Vektoranordnung im zweidimensionalen Bildsignal war es möglich, einen prädiktiven Vektorquantisierer (Blockcode) so in eine Treecodierung (Faltungscode) einzubetten, daß die Arbeitsweise beider Komponenten weitgehend voneinander trennbar wird.

2. Es konnte gezeigt werden, daß der Vektorquantisierer in der Lage ist, eine Vorauswahl aussichtsreicher Codewort-Kandidaten zu treffen, wodurch eine gute Wirkungsweise in Zusammenhang mit suboptimalen Suchalgorithmen der Treecodierung erzielt wird.

3. Der erhöhte Freiheitsgrad, den ein Vektorcode aufgrund der Ausnutzung mehrdimensionaler Verteilungsdichtefunktionen des Prädiktionsfehlersignals bietet, wirkt sich positiv auf sein Zusammenwirken mit der Treecodierung aus. Der Gewinn der prädiktiven Treecodierung mit Vektorquantisierung (PTVQ) gegenüber der prädiktiven Vektorquantisierung ist erheblich höher als der einer prädiktiven Treecodierung mit deterministischem Codebuch gegenüber DPCM.

4. Stochastische Codebücher sind in prädiktiven Bildcodierverfahren unbrauchbar; Vektoranregungen mit korrelierten Vektoren bieten im niedrigen Bitratenbereich Vorteile gegenüber unkorrelierten Anregungen.

5. Komponenten zur Adaption linearer Prädiktionsfilter verlieren bei prädiktiven Bildcodierverfahren an Bedeutung, wenn die Codewortlänge für die Anregungsfunktion des Synthesefilters erhöht wird.

6. Verfahren zur lokalen Adaption der Bitrate können auch in prädiktiven Bildcodierverfahren mit großen Codewortlängen wirksam werden.

7. Durch eine Kombination prädiktiver Codierverfahren mit dem Verfahren der Teilbandcodierung (SBC) ist auch bei Verwendung großer Codewortlängen ein weiterer Gewinn erzielbar.

Es konnte gezeigt werden, daß das PTVQ-Verfahren als prädiktives Codierverfahren nicht nur mit den im Bereich der Bildcodierung häufig bevorzugten Transformationscodierverfahren konkurrenzfähig ist, sondern diese im Bereich niedriger Bitraten in Bezug auf die Fähigkeit zur naturgetreuen Wiedergabe von Details übertrifft. Ein weiterer großer Vorteil des PTVQ-Verfahrens im Vergleich zu Transformationscodierverfahren - bei denen im Empfänger eine rechenaufwendige inverse Transformation durchzuführen ist - ist die sehr einfache Decodiererstsruktur. Hierdurch wird das Verfahren für den Einsatz in "Broadcast"-Anwendungen (bei denen ein Sender viele Empfänger versorgt) und in Bilddatenbanken (bei denen einmal codierte Bilder vielfach abgerufen werden) attraktiv.

Die Untersuchungen im Rahmen dieser Arbeit weisen nur die allgemeine Tauglichkeit des PTVQ-Verfahrens und seine prinzipielle Anwendbarkeit nach. Die notwendige Optimierung muß später für eine konkrete Realisierung bei einer bestimmten praktischen Anwendung mit vorgegebener Bitrate erfolgen. Dies betrifft vor allem folgende Punkte:

1. Zur Verringerung der Codiererkomplexität sollte im Vektorquantisierer nicht die bisher verwendete vollständige Suche, sondern ein suboptimales, baumstrukturiertes Suchverfahren eingesetzt werden. Es ist dabei zu erproben, wie weit eine Reinvestition der so gewonnenen Komplexitätsverringerung in die Treecodierungskomponente (Erhöhung der Suchintensität) Gewinne bringt.

2. Die Wirkung einer adaptiven Nachfilterung kann nur bei Kenntnis der bei einer bestimmten Bitrate auftretenden Verzerrung genau untersucht werden.

3. Die Wikrungsweise adaptiver Komponenten bei den klassifizierenden Varianten des Verfahrens kann nur bei Vorgabe eines konkret angestrebten Bitratenbereiches endgültig optimiert werden. Eine Kombination der klassifizierend-adaptiven Verfahren mit den Verfahren adaptiver Präditkion, die weitere Gewinne erwarten läßt, wurde bisher nicht untersucht.

4. Bei den Verfahren mit vorwärtsgesteuert-adaptiver Prädiktion sollte die Möglichkeit einer Vektorquantisierung der Prädiktorparameter untersucht werden. Ein Codebuch mit Prädiktorparamentern müßte gleichzeitig so optimiert werden, daß es nur stabile Koeffizientensätze enthält.

5. Eine Verfahrensoptimierung unter visulellen Gesichtspnkten wurde bisher nicht vorgenommen. Hierfür bieten sich vor allem eine Kanten- und Texturdetektion im Originalsignal zur speziellen Codeadaption bei den klassifizierenden Verfahren sowie eine Gewichtung des Codierungsfehlers im Frequenzbereich bei den PTVQ-SBC-Verfahen an.

6. Bei Forschung einer progressiven Festbildübertragung (stufenweise qualitätsverbesserter Bildaufbau) ist das Verfahren so zu modifizieren, daß der Codierer mehrstufig arbeitet.

Im extrem niedrigen Bitratenbereich (0,1-0,3 bit/pixel) bestehen gute Aussichten, durch Anwendung von Methoden der digitalen Bildrestauration weitere Qualitätsverbesserungen zu erzielen. Hier sind sowohl Verfahren denkbar, die nur decodierseitig arbeiten, aber auch solche, die die Möglichkeit der empfängerseitigen Nachbearbeitung bereits bei der Codeauswahl im Codierer berücksichtigen.

Schließlich sollte auch eine Verallgemeinerung des bisher zweidimensionalen Verfahrens auf eine dreidimensionale Bewegtbildocierung untersucht werden. An dieser Stelle seien nur zwei mögliche Varianten genannt:
- Einbettung des zweidimensionalen Codierverfahrens in ein hybrides, dreidimensionales Verfahren mit einer
bewegungskompensierenden Prädiktion entlang der Zeitachse,
- Kombination einer prädiktiven Treecodierung entlang der zeitlichen Dimension mit einer zweidimensionalen Teilband-Vektorquantisierung in den örtlihen Dimensionen.

Das entwickelte Codiererkonzept einer separierbaren Kombination von prädiktiver Block- und Faltungscodierung (Prädiktive Tree-Vektorquantisierung) setzt neue Akzente gegenüber den in der Fest- und Bewegtbildcodierung vorzugsweise verwendeten Transformationscodierverfahren. Dieses prädiktive Codierverfahren kann selbst detailreiche Bildregionen bei Bitraten zwischen 0,5 und 1 bit/pixel noch in guter Qualität wiedergeben. Es eignet sich damit hervorragend für regionenorientierte Bildcodierungsanwendungen bei sehr niedrigen Bitraten, bei denen nach einer Segmentierung und Klassifizierung wenige detailreiche Bildteile sehr effizient zu codieren sind. Der Bedarf nach einem derartigen Verfahren besteht sowohl in der Bewegtbildocierung mit bewegungskompensierender Prädiktion bei Szenenwechseln und schwer erfaßbaren Bewegungen, als auch in Kontur-Textur-Codier-Verfahren zur Festbildcodierung. Ein besonderer Vorteil des entwickelten Verfahrens ist in diesem Zusammenhang darin zu sehen, daß es keine feste Blockstruktur besitzt, sondern durch einfache Variation der Vektorlängen Regionen mit beliebigen Konturformungen codiert werden können.

[BibTeX]