1、Februar 2009DEUTSCHE NORM DKE Deutsche Kommission Elektrotechnik Elektronik Informationstechnik im DIN und VDEPreisgruppe 12DIN Deutsches Institut fr Normung e.V. Jede Art der Vervielfltigung, auch auszugsweise, nur mit Genehmigung des DIN Deutsches Institut fr Normung e.V., Berlin, gestattet.ICS 33
2、.160.60!$U%k“1500272www.din.deDDIN EN 62503Multimedia-Qualitt Verfahren zur Beurteilung der Synchronisation von Ton und Bild(IEC 62503:2008);Deutsche Fassung EN 62503:2008Multimedia quality Method of assessment of synchronization of audio and video (IEC 62503:2008);German version EN 62503:2008Qualit
3、 des dispositifs multimdia Mthode devalution de la synchronisation des flux audio et vido (CEI 62503:2008);Version allemande EN 62503:2008Alleinverkauf der Normen durch Beuth Verlag GmbH, 10772 Berlin www.beuth.deGesamtumfang 14 SeitenDIN EN 62503:2009-02 2 Beginn der Gltigkeit Die von CENELEC am 20
4、08-10-01 angenommene EN 62503 gilt als DIN-Norm ab 2009-02-01. Nationales Vorwort Vorausgegangener Norm-Entwurf: E DIN IEC 62503:2007-10. Fr diese Norm ist das nationale Arbeitsgremium K 742 Audio-, Video- und Multimediasysteme, -gerte und -komponenten“ der DKE Deutsche Kommission Elektrotechnik Ele
5、ktronik Informationstechnik im DIN und VDE (http:/www.dke.de) zustndig. Die enthaltene IEC-Publikation wurde vom TC 100 Audio, video and multimedia systems and equipment“ erarbeitet. Das IEC-Komitee hat entschieden, dass der Inhalt dieser Publikation bis zu dem auf der IEC-Website unter http:/websto
6、re.iec.ch“ mit den Daten zu dieser Publikation angegebenen Datum (maintenance result date) unverndert bleiben soll. Zu diesem Zeitpunkt wird entsprechend der Entscheidung des Komitees die Publikation besttigt, zurckgezogen, durch eine Folgeausgabe ersetzt oder gendert. Fr den Fall einer undatierten
7、Verweisung im normativen Text (Verweisung auf eine Norm ohne Angabe des Ausgabedatums und ohne Hinweis auf eine Abschnittsnummer, eine Tabelle, ein Bild usw.) bezieht sich die Verweisung auf die jeweils neueste gltige Ausgabe der in Bezug genommenen Norm. Fr den Fall einer datierten Verweisung im no
8、rmativen Text bezieht sich die Verweisung immer auf die in Bezug genommene Ausgabe der Norm. Der Zusammenhang der zitierten Normen mit den entsprechenden Deutschen Normen ergibt sich, soweit ein Zusammenhang besteht, grundstzlich ber die Nummer der entsprechenden IEC-Publikation. Beispiel: IEC 60068
9、 ist als EN 60068 als Europische Norm durch CENELEC bernommen und als DIN EN 60068 ins Deutsche Normenwerk aufgenommen. EUROPISCHE NORM EUROPEAN STANDARD NORME EUROPENNE EN 62503 Oktober 2008 ICS 33.160.01 Deutsche Fassung Multimedia-Qualitt Verfahren zur Beurteilung der Synchronisation von Ton und
10、Bild (IEC 62503:2008) Multimedia quality Method of assessment of synchronization of audio and video (IEC 62503:2008) Qualit des dispositifs multimdia Mthode devalution de la synchronisation des flux audio et vido (CEI 62503:2008) Diese Europische Norm wurde von CENELEC am 2008-10-01 angenommen. Die
11、CENELEC-Mitglieder sind gehalten, die CEN/CENELEC-Geschftsordnung zu erfllen, in der die Bedingungen festgelegt sind, unter denen dieser Europischen Norm ohne jede nderung der Status einer nationalen Norm zu geben ist. Auf dem letzten Stand befindliche Listen dieser nationalen Normen mit ihren bibli
12、ographischen Angaben sind beim Zentralsekretariat oder bei jedem CENELEC-Mitglied auf Anfrage erhltlich. Diese Europische Norm besteht in drei offiziellen Fassungen (Deutsch, Englisch, Franzsisch). Eine Fassung in einer anderen Sprache, die von einem CENELEC-Mitglied in eigener Verantwortung durch b
13、ersetzung in seine Landessprache gemacht und dem Zentralsekretariat mitgeteilt worden ist, hat den gleichen Status wie die offiziellen Fassungen. CENELEC-Mitglieder sind die nationalen elektrotechnischen Komitees von Belgien, Bulgarien, Dnemark, Deutschland, Estland, Finnland, Frankreich, Griechenla
14、nd, Irland, Island, Italien, Lettland, Litauen, Luxemburg, Malta, den Niederlanden, Norwegen, sterreich, Polen, Portugal, Rumnien, Schweden, der Schweiz, der Slowakei, Slowenien, Spanien, der Tschechischen Republik, Ungarn, dem Vereinigten Knigreich und Zypern. CENELEC Europisches Komitee fr Elektro
15、technische Normung European Committee for Electrotechnical Standardization Comit Europen de Normalisation Electrotechnique Zentralsekretariat: rue de Stassart 35, B-1050 Brssel 2008 CENELEC Alle Rechte der Verwertung, gleich in welcher Form und in welchem Verfahren, sind weltweit den Mitgliedern von
16、 CENELEC vorbehalten. Ref. Nr. EN 62503:2008 DDIN EN 62503:2009-02 EN 62503:2008 2 Vorwort Der Text des Schriftstcks 100/1277/CDV, zuknftige 1. Ausgabe von IEC 62503, ausgearbeitet von dem Technical area 11 Quality for audio, video and multimedia systems“ des IEC TC 100 Audio, video and multimedia s
17、ystems and equipment“, wurde der IEC-CENELEC Parallelen Abstimmung unterworfen und von CENELEC am 2008-10-01 als EN 62503 angenommen. Nachstehende Daten wurden festgelegt: sptestes Datum, zu dem die EN auf nationaler Ebene durch Verffentlichung einer identischen nationalen Norm oder durch Anerkennun
18、g bernommen werden muss (dop): 2009-07-01 sptestes Datum, zu dem nationale Normen, die der EN entgegenstehen, zurckgezogen werden mssen (dow): 2011-10-01 Der Anhang ZA wurde von CENELEC hinzugefgt. Anerkennungsnotiz Der Text der Internationalen Norm IEC 62503:2008 wurde von CENELEC ohne irgendeine A
19、bnderung als Europische Norm angenommen. DIN EN 62503:2009-02 EN 62503:2008 3 Inhalt SeiteVorwort .2 Einleitung4 1 Anwendungsbereich.5 2 Normative Verweisungen .5 3 Begriffe .5 4 berblick ber Verfahren der Beurteilung5 5 Subjektive Bewertung von Lippensynchronitt 6 5.1 Merkmale der Bewertung .6 5.2
20、Herstellung von Test-Videoclips und Test-Videosequenz .6 5.2.1 Materialauswahl fr einen Test-Videoclip .6 5.2.2 Erstellung einer Test-Videosequenz .7 5.3 Verfahren und Bedingungen zur Beurteilung von Lippensynchronitt am Schnitt 33.7 5.4 Berichterstattung ber das Ergebnis der Beurteilung 8 6 Datenve
21、rarbeitung9 6.1 Merkmale der Beurteilung 9 6.2 Verfahren der Beurteilung 9 6.3 Berichterstattung ber das Ergebnis einer Schtzung.10 Literaturhinweise 11 Anhang ZA (normativ) Normative Verweisungen auf internationale Publikationen mit ihren entsprechenden europischen Publikationen12 Bilder Bild 1 ber
22、sicht zur Bestimmung der Lippensynchronitt.6 Bild 2 Herstellung von Test-Videoclips mit zeitverschobenem Audio .7 Bild 3 Beispiel einer subjektiven Bewertung von Lippensynchronitt .9 Bild 4 Normierte Antwort fr bewertete Beeintrchtigung, verursacht durch Lippensynchronittsversatz10 Tabellen Tabelle
23、1 Fnfstufige Beeintrchtigungsskala und Erluterung der subjektiven Punktewertung .8 DIN EN 62503:2009-02 EN 62503:2008 4 Einleitung Heutige Multimediasysteme sind in digitaler Technologie ausgefhrt. Abhngig davon, welche digitale Verarbeitung angewendet wird, variieren die Zeitverzgerungen zwischen d
24、en Wiedergabekanlen als wahrnehmbarer Reiz fr einen Zuschauer. Ein Beispiel ist die Videoverzgerung gegenber dem Audio, die mit Begriffen wie lippensynchron oder AV-synchron gekennzeichnet wird. Eine Videoverzgerung gegenber dem Audio wird unvermeidbar sein fr gro dimensionierte Bildschirme, da die
25、erforderliche Zeit zu Wiedergabe und Darstellung proportional zur Anzahl der Bildelemente ist. Es sollten auch weitere Faktoren in Betracht gezogen werden. Dazu gehrt das Synchronisationsproblem bei der Medienerfassung, bei der Produktion, bei der Nachbearbeitung, beim Bearbeiten nach verschiedenen
26、Gesichtspunkten der Kombination dieser Vielfachmedien, um sie als Multimedia“ auszustrahlen oder aufzuzeichnen. Es besteht Bedarf an internationalen Standards, um die folgenden drei zugehrigen Verfahren zur Verfgung zu stellen: a) ein objektives Verfahren zur Messung von Unterschieden in der Laufzei
27、t zwischen Audio und Video (Lippensynchronitt) bei der Wiedergabe von multimedialen Systemen und Gerten; b) ein subjektives (bzw. wahrnehmbares) und statistisches Verfahren der Bewertung einer Gesamtdifferenz von Verzgerungen zwischen einer realen Welt und einer wiedergegebenen Szene mit Ton; c) ein
28、 Schtzverfahren fr implizierte Unterschiede von Verzgerungen, die empfangener, aufgezeichneter oder wiedergegebener Multimedia innewohnen. Diese Internationale Norm befasst sich mit Punkt b), indem sie typisches Multimediamaterial benutzt, wie zum Beispiel Brustaufnahmen von Nachrichtensprechern weg
29、en der Leichtigkeit, die Synchronisation von Ton und Bild zu definieren. Da ein Bereich zulssiger wahrnehmbarer Fehlsynchronisation und Empfindlichkeit von Zuschauern fr vorauseilenden und nacheilenden Ton gegenber begleitendem Video abhngt von der menschlichen Wahrnehmung und den Bedingungen fr ein
30、e Beurteilung, muss ein klar definiertes Verfahren fr die Beurteilung solcher Eigenschaften standardisiert werden. Diese Internationale Norm ist bestimmt zur Ergnzung der Recommendation ITU-R BT.1359-1 11)sowie als Teilantwort auf die Anfrage von ITU-R an IEC, die in der Recommendation ITU-R BT.1377
31、 2 spezifiziert worden ist. Die technischen Inhalte basieren auf einer im April 2006 durchgefhrten Studie der Fakultt fr Ingenieur-wissenschaften der Chiba University in Japan. 1)Die Zahlen in eckigen Klammern beziehen sich auf die Literaturhinweise. DIN EN 62503:2009-02 EN 62503:2008 5 1 Anwendungs
32、bereich Diese Internationale Norm enthlt ein subjektives (oder erkennbares) und ein statistisches Verfahren zur Beurteilung des gesamten, d. h. vom einen bis zum anderen Ende auftretenden Unterschieds der Verzgerungen zwischen der realen Welt und den wiedergegebenen Szenen in Bezug auf in einem Medi
33、um aufgezeichnete Bilder und begleitenden Ton. Diese Internationale Norm legt keine Grenzwerte fr jene Ergebnisse fest, die man durch die Anwendung der in dieser Norm verfgbaren Regeln erhlt. Sie schliet Anwendungen fr professionelle Rundfunksysteme aus. 2 Normative Verweisungen Die folgenden zitier
34、ten Dokumente sind fr die Anwendung dieses Dokuments erforderlich. Bei datierten Verweisungen gilt nur die in Bezug genommene Ausgabe. Bei undatierten Verweisungen gilt die letzte Ausgabe des in Bezug genommenen Dokuments (einschlielich aller nderungen). ITU-R BT.500-11:2002, Methodology for the sub
35、jective assessment of the quality of television pictures 3 Begriffe Fr die Anwendung dieses Dokuments gelten die folgenden Begriffe. 3.1 Lippensynchronitt Videoverzgerung gegenber dem begleitenden Audio 3.2 Ausreier Anzahl subjektiver Beurteilungen auerhalb von m s, mit m als Probenmittel von Origin
36、albeurteilungen einer Reihe von Versuchspersonen fr die gleiche Videoverzgerung und s als Standardabweichung aller Beurteilungen 3.3 Versuchsperson blicher untrainierter Zuschauer von Audio- und Videowiedergabe; Stichprobe aus individuellen Vertretern der Allgemeinheit 3.4 Test-Videoclip kurze Folge
37、 von Videobildern mit begleitendem Ton zur Verwendung als Original 3.5 Test-Videosequenz Zufallsfolge von Test-Videoclips, bei denen die Tonkanle gegenber dem Original zeitversetzt sind 4 berblick ber Verfahren der Beurteilung Bild 1 zeigt eine bersicht mglicher objektiver Messverfahren und subjekti
38、ver Verfahren der Beurteilung zur Erfassung der notwendigen Parameter bezglich der Lippensynchronitt. DIN EN 62503:2009-02 EN 62503:2008 6 Bild 1 bersicht zur Bestimmung der Lippensynchronitt Links in Bild 1 befindet sich die reale Welt und rechts in Bild 1 ist die reproduzierte Welt. Lippensynchron
39、itt beim Schnitt 00 heit, die Bildverzgerung gegenber dem begleitenden Ton ist normalerweise null. Mit anderen Worten: Gegenber dem begleitenden Audio wird keine Videoverzgerung erwartet; 00.t= Wo 00t vorhersehbar ist, muss es ebenfalls in Betracht gezogen werden. Lippensynchronitt beim Schnitt 11 w
40、ird vermutlich eingefgt durch die getrennte Erfassung physikalischer Phnomene durch Mikrofone und Videokameras, gefolgt noch von weiteren getrennten digitalen Verarbei-tungsstufen fr die Audio- und Videodaten. Es wird Lippensynchronitt von 10t verursacht. ANMERKUNG Im Falle einer MPEG-2-Codierung is
41、t eine Synchronisationsvorschrift implementiert, die sowohl einen Decoding Time Stamp“ (DTS) (dt.: Dekodierungs-Zeitmarke) als auch einen Presentation Time Stamp“ (PTS) (dt.: Darbietungs-Zeitmarke) nutzt, die beide im Nachrichtenkopf des Packetized Elementary Stream“ (PES) (dt.: paketierter Elementa
42、rstrom) eingebettet sind. Siehe hierzu ISO/IEC 13818-1 11. Lippensynchronitt beim Schnitt 22 wird vermutlich eingefgt durch den Wiedergabeprozess fr Audio- und Videokanle, im Einzelnen z. B. durch Dekomprimierung, Darstellung und Wiedergabe. Es wird Lippen-synchronitt von 20t verursacht, die mit Mul
43、timedia-Referenztestmaterial mit 10t = gemessen werden kann. Lippensynchronitt beim Schnitt 33 entsteht in der reproduzierten Multimediawelt und wird von Versuchspersonen bewertet. Subjektive Beurteilungsergebnisse von Lippensynchronitt werden statistisch analysiert, um einen geschtzten Wert fr 30t
44、zu finden korrespondierend zum Aufwand an Kompen-sation fr eine gerade synchronisierte Wiedergabe. 5 Subjektive Bewertung von Lippensynchronitt 5.1 Merkmale der Bewertung Subjektive Bewertungsstufe einer Fehlsynchronisation von Video und Audio. 5.2 Herstellung von Test-Videoclips und Test-Videoseque
45、nz 5.2.1 Materialauswahl fr einen Test-Videoclip Da Lippensynchronitt eine Art der menschlichen Wahrnehmung ist, darf sie von den Videoinhalten und dem sie begleitenden Audio abhngig sein. Besonders wenn sie mit den Lippenbewegungen eines Sprechers verknpft ist, kann die bereinstimmung zwischen gesp
46、rochener Sprache und einer Muttersprache das Ergebnis beeinflussen. DIN EN 62503:2009-02 EN 62503:2008 7 ANMERKUNG Um in dieser Internationalen Norm funktionierende Beispiele zur Verfgung zu stellen, wird von einem gebten professionellen Nachrichtensprecher geuerte japanische Sprache von Versuchsper
47、sonen mit der gleichen Muttersprache betrachtet und gehrt. Eine Brustaufnahme eines Nachrichtensprechers muss ausgewhlt werden und sollte etwa eine Dauer von 10 s bis 20 s haben. Die Daten des Audiokanals des Videoclips mssen als Zeitreferenz verwendet werden. Mgliche Zeitdauern 1t beim Schnitt 11,
48、verursacht durch Fehlsynchronisation in diesem Videoclip-Original, sind nicht bekannt. Diese Internationale Norm liefert jedoch das Verfahren, die Gesamtlippen-synchronitt 3t einschlielich 0t und 1t zu schtzen, nmlich 3012.tttt = + + 5.2.2 Erstellung einer Test-Videosequenz Die Test-Videosequenz mus
49、s eine zufllige Folge des in 5.2.1 ausgewhlten Videoclips sein, in der jeder der Audiokanle durch zeitlich verschobene Audiodaten ersetzt werden muss mit der erforderlichen Zeitdauer von Fllmaterial als Vorspann oder als Nachspann, abhngig von der Richtung der Zeitverschiebung. In Bild 2 wird die Herstellung solcher Videocl