用于缩放显示mpeg2编码图像的编码方法和设备的制作方法_第1页
用于缩放显示mpeg2编码图像的编码方法和设备的制作方法_第2页
用于缩放显示mpeg2编码图像的编码方法和设备的制作方法_第3页
用于缩放显示mpeg2编码图像的编码方法和设备的制作方法_第4页
用于缩放显示mpeg2编码图像的编码方法和设备的制作方法_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用于缩放显示mpeg2编码图像的编码方法和设备的制作方法专利名称:用于缩放显示mpeg2编码图像的编码方法和设备的制作方法技术领域:本发明涉及一种与MPEG2标准兼容的编码和解码的方法和设备,用于缩放显示传输的图像。对图像的缩放包含对这一图像的一部分进行放大或者缩小。因此它包含修改图像中被选用进行缩放显示的部分的水平和垂直尺寸。背景技术:目前,基于互动的应用要求必须具有观看缩小或者放大的图像的能力。例如电子节目指南使用缩小尺寸的图像以允许以OSD(代表在屏显示)的形式在屏幕上显示辅助信息。当人们期望将注意力集中于源图像中某一部分的显示的时候,图像放大可能也是必需的。这里提到的方法可以适用于任何类型的使用按照MPEG2标准编码的数据流的设备,例如解码器、DVD读取器/记录器、互联网机顶盒等等。数据的传送可能通过卫星、电缆、陆地传输等等。MPEG2压缩并不是一个基于对象的处理,经过解码的显示图像通常是经过编码的源图像的一个拷贝。因此为了获得缩放模式下的特定显示,需要对源图像按照它必须显示的形式进行编码,也就是说在对这一源图像之行了缩放以后进行编码。因此,例如来自一个提供视频序列的工作室的源图像在视频数据进行编码和传输之前进行处理。对源图像执行缩放操作,并且它是经过了和视频序列中其他的图像同样的编码的新的“经过缩放的”图像。这种方法的缺点是由于它缺乏应有的灵活性而受到限制。必须在编码的时候确定要执行的缩放。这些缩放在数据的接收时是不能再在解码器级别上被修改的,例如作为一个浏览者选择的数据或者参数功能。发明内容本发明的目的在于减少上述的缺点。因此,本发明的主题是允许对按照MPEG2标准编码的图像进行缩放显示的编码方法。经过缩放的图像按照经过编码的图像的水平和垂直相似放大率进行定义,其特征在于执行下面的步骤通过应用水平和垂直缩放率来计算原始显示长方形的水平和垂直尺寸,从中获得按照轮廓和级别信息定义的目标显示长方形的尺寸。在MPEG2视频数据流的display_horizontal_size和display_vertical_size字段中存储原始显示长方形的水平和垂直尺寸。按照一个变化,由当缩小的时候在被显示图像中的图像的位置或者由在放大的时候将被显示的经过编码的图像的部分来定义经过缩放的图像,上述方法的特点在于它还执行下面的步骤针对经过编码的图像的中心计算原始显示长方形的中心位置,从而定义水平和垂直偏移,在MPEG2视频数据流的frame_centre_horizontal_offset和frame_centre_vertical_offset字段中存储定义水平和垂直偏移的信息项。本发明的主题也是一种用来执行上述编码方法的编码设备,其特征在于包含链接到MPEG2编码器的语法修改器,用于修改从编码器来的原始MPEG2数据流的display_horzontal_size和dispay_vertical_size字段以及frame_centre_horizontal_offset和frame_centre_vertical_offset字段,分别作为期望的缩放的幅度和位置的函数。按照一个变化,上述设备的特征在于它包含了链接到编码器和语法修改器的应用程序同步器,用以在与期望缩放功能的图象相对应的MPEG2数据流的两个时间代码时刻tc0和tc1之间控制语法修改。本发明的想法是在由按照视频MPEG2标准编码的二进制视频数据流语法所定义的字段中传送一定数量的与图像缩放相关的参数。这些字段从标准提供的范围中选择。这样,编码器可以动态地管理与缩放相关的参数,也就是将要看到的图像的大小、它在被显示图像中的位置、在缩放模式下将要看到的被编码图像的部分,可以这样做而不用改变被编码图像的诸如水平尺寸和垂直尺寸这些编码参数。图l以图表的形式示出了字段应用的例子;图2给出了图像缩小的例子并展示了一个初始显示长方形8,其中包含了对应于被编码图像1的被编码图像7;图3针对一种实现方式示出了设备的简化图;图4在第一条线中表现了在应用程序运行的时刻tc0和tc1之间由编码器构建的图像13,以及在应用程序开始之前的图像和应用程序结束之后的图像,在第二条线中表现了当应用程序运行的时候解码器显示的图像14,应用程序执行以前以及应用程序执行之后的图像。具体实施方式下面回顾在视频MPEG2标准(ISO/CEI标准13818-2)中与将要被编码和显示的图像的尺寸相关的各种不同的已存的字段被编码图像或者更确切地说可显示的图像的大小在MPEG2数据流的序列头中定义(视频MPEG2标准的第6.3.3段),也可以选择在序列扩展中定义(视频MPEG2标准的第6.3.5段)。第一个字段参考了horizontal_size、vertical_size字段和horizontal_size_value、vertical_size_value以及horizontal_size_extension、vertical_size_extension字段。这些字段实际上定义了整个图像(两帧)中可显示的发光部分的像素宽度以及可显示的发光部分就线数而言的像素高度。包含视频的图像部分以及因此不需要包含整数数量的宏块的可显示图像部分被放置在被编码图像的左边缘和上边缘。被显示的图像,其实是它的一部分的大小在sequence_display_extension中定义(视频MPEG2标准的第6.3.6段)。需要注意的是这个扩展并没有定义显示过程,这个扩展的信息与解码过程没有任何关系,而且按照MPEG2规范的规定,这一信息可以被解码器丢弃。两个结构display_horizontal_size和display_vertical_size一起定义了一个可以被看作是可显示的活动区域的长方形。如果这个显示的长方形比被编码的两帧图像要小,那么可以想象显示过程将只能显示这个图像的一部分。相反,如果显示的长方形比经过编码的两帧图像要大,则显示过程可能将在显示设备的一部分而不是整个显示设备上显示重新构建的两帧图像。MPEG2标准提出了一个picture_diplay_extension结构,这也是ISO/CEI文档13818-2的第6.3.12段的主题。picture_display_extension使得图像可以按照图像显示长方形的位置进行偏移,它的大小由前面所述的“sequence_display_extension”结构规定。有一个应用程序与图像的再组织相关。frame_centre_horizontal_offset和frame_centre_vertical_offset字段指示了重新构建的图像的中心与显示长方形的中心的水平和垂直的偏移。图像的中心偏移可以用来为执行全屏的帧重建程序提供服务,通过这一偏移定义了一个对应于全屏的长方形区域,并且将这一区域在整个重新构建的图像上进行了全景式转换。这一程序尤其用在从16/9格式编码的图像转换为4/3格式显示的图像的时候,这样由4/3格式定义的区域就可以包含原来的16/9格式的图像中最感兴趣的部分。需要注意的是在标准中关于序列方面(序列头、序列显示扩展)定义的字段实际上可能在每一幅图像上进行传输(“用于扩展触发代码的识别码”标准中表6.2里的协议保留值)。缩放的幅度。这里提出的想法是将包含在“display_horizontal_size”和“display_vertical_size”字段中的信息作为对缩放幅度的定义。除了在这些字段的帮助下像MPEG2标准中建议的那样定义显示长方形或者被显示图像的尺寸以外,还可以定义“初始显示长方形”或者原始图像的尺寸,缩放将要从这一尺寸执行。这个初始显示长方形的尺寸是这样的,对这个长方形所应用的缩放给出的图像的大小正是目标显示长方形的大小,也就是屏幕的大小,就像编码器通过轮廓以及级别的选择所定义的那样。这样来说,初始显示长方形的尺寸大于目标显示长方形的时候就需要对图像进行缩小,初始显示长方形的尺寸小于目标显示长方形的时候就需要对图像进行放大。因此缩放的幅度通过计算从级别和轮廓信息中得出的目标显示长方形的大小除以在“display_horizontal_size”和“display_vertical_size”字段中表达的初始显示长方形的大小的比值而获得。当然,在将16/9格式转换为4/3格式的时候,两个字段中的后者不应该用于传达多余的信息。下面给出了上述的字段的例子应用,而且在图1中以图表的形式进行了展示。让我们考虑一个经过解码或者重新构造的图形,如图中的标记1,它的大小是480像素576线(这实际上是在MPEG编码器级别进行编码的图像的大小),一个目标显示长方形或者屏幕大小,也就是标记2,是720像素576线。下表说明了不同的缩放幅度是在“display_horizontal_size”和“display_vertical_size”字段中传达的信息的一项功能。h_zoom和v_zoom值对应于水平和垂直的缩放。小于1的缩放幅度意味着重新构建以后获得的图像的大小与被编码的图像的大小之比小于1,缩放幅度大于1表示获得的图像的大小与被编码的图像的大小之比大于1。如果这个值等于1,那么获得的图像也就是重新构建的图像。注释1图像缩小注释2图像放大注释3大小大于被编码图像的大小的、从被编码图像获得的图像填充了屏幕。从轮廓和级别信息以及从图像格式信息(16/9)得出的目标显示长方形(或者目标显示)比被编码的图像的大小要大。标记为3、4、5、6的图象分别对应于下面的值h_zoom=v_zoom=0.50h_zoom=v_zoom=1.00h_zoom=1.50,v_zoom=1.00h_zoom=v_zoom=2.00display_horizontal_size和display_vertical_size字段是14位的字段。最大的十进制数值等于16383,在我们的例子中对应的最大缩小值在水平上是720/16383,在垂直上是576/16383。被缩放图像的位置。图像显示扩展结构的frame_centre_horizontal_offset和frame_centre_vertical_offset字段用于传达被缩放图像的位置信息。同样对应于被编码图像的中心相对于初始显示长方形的中心的偏移。被编码图像(实际上是可显示图像)的中心是由序列头的“horizontal_size”和“vertical_size”字段定义的区域的中心。和上面所说的相同,初始显示长方形的中心是由“display_horizontal_size”和“display_vertical_size”字段定义的区域的中心。图2给出了图像缩小的例子并展示了一个初始显示长方形8,其中包含了对应于被编码图像1的被编码图像7。水平和垂直箭头表示被编码图像中心相对于初始显示长方形中心的水平和垂直偏移。让我们举例考虑一个被解码的或者重新构建的大小为480像素*576线的图像,“display_horizontal_size”和“display_vertical_size”字段相应地传达了值1440(像素)和1152(线),以及一个大小为720(像素)*576(线)的目标显示长方形。h_zoom=720/1440=0.50v_zoom=576/1152=0.50如果我们希望在初始显示长方形的左上部分放置一个经过缩放的图像,例如在距离初始显示长方形的左上角的水平距离400像素、垂直距离300线的地方,偏移信息将有下面的值frame_centre_horizontal_offset=(400-1440/2)×16frame_centre_vertical_offset=(3OO-1152/2)×16这两个值按照MPEG规范将要被丢弃。将这两个值乘以16的原因是偏移是以1/16像素为单位定义的。值400和300对应了图像的预缩放值,如果我们期望将经过缩放的图像的位置定义在图像在屏幕上实际看到的位置,这些值必须根据缩放的幅度进行更正。在图像放大的情况下,在被编码图像(7)中的初始显示长方形(8)的位置定义了我们期望看到的放大的被编码图像的区域。本发明的一个专门的实现方式涉及到了从交互应用中得到的视频的动态格式。图3针对这样的一个实现方式示出了设备的简化图。MPEG2视频编码器91到9n接收不同的视频源图像。图像按照一个恒定的图像尺寸,例如720像素乘以576线进行编码。作为视频编码器的一部分或者不作为视频编码器的一部分的视频语法修改电路10i到10n为相关的编码器i到n提供了用于修改MPEG2视频语法字段的接口。用于应用程序12的工具箱包含应用程序注入器,例如OpenTV、MediaHighway、Java格式,这些都是已经注册的商标。应用程序同步器,它将应用程序与视频进行同步,用于依照MPEG2基本流时间代码信息执行应用程序,。这个工具箱12接收来源于不同的编码器i到n的信息并向语法修改电路10i到10n传输用于修改这些字段的数据。它链接到多路复用电路11以段的形式传输私有数据和它们的PID(分组标识符)。在可能的情况下,通过视频语法修改电路10i到10n的不同的编码器91到9n也可能链接到多路复用电路11,多路复用电路11在不同的基本流和私有数据的基础上提供传输流。随后这个传输流被使用以将其传输到IRD接收机(代表集成的接收机/解码器)。其中,这个并没有在图中描述的接收机包含用于对音频/视频数据进行解码的解码器以及用于执行应用程序分组的应用程序引擎。它还可能是一个简单的诸如硬盘、DVD或者类似的数字存储装置,以用于随后对记录的数据的使用。语法修改电路10对MPEG2视频语法的基本字段进行修改以允许按照上面描述的过程执行对图像的缩放。在视频流中,这些字段在一个对应于应用程序执行期间的时间段中被修改。应用程序(私有数据)传输对应于初始和结束图像的时间代码,在这段时间里应用程序将在接收机级别被执行。因此这就是对应于应用程序的起始和结束的“起始时间代码”信息(tc0)和“停止时间代码”信息(tc1)。在接收机中,应用程序引擎对不同的数据流提取出“时间代码”信息,而且对给定的流,应用程序从对应于tc0的时间代码的读取到应用程序停止的tc1时刻触发。在这两个时刻中间,在缩放模式下执行显示。应用程序同步器12接收到不同编码器的时间代码。它通过语法修改电路在对应于应用程序开始的起始时间代码时刻和对应于应用程序中止的停止时间代码时刻之间对MPEG2视频语法的字段进行修改,这样就可以使得针对位于这两个时刻之间的图像按照上述的方法缩小(或者增加)视频图像的尺寸。这个“起始时间代码”和“停止时间代码”信息可以从外部数据生成。例如它可以从对人们期望能执行缩放的时间段的图像序列的识别而获得,序列由这些时间代码来定义。在一个例子中,应用程序通过向图像中插入信息来对处于交互OSD显示模式下的被缩小图像的显示进行补充。这种交互模式使通过中断应用程序的方式返回到正常模式成为可能。图4在第一条线中表现了在应用程序运行的时刻tc0和tc1之间由编码器构建的图像13,以及在应用程序开始之前的图像和应用程序结束之后的图像。在第二条线中表现了当应用程序运行的时候解码器显示的图像14,应用程序执行以前以及应用程序执行之后的图像。在时刻tc0和tc1之间,作为从上面定义的字段中读取数据的功能,接收机中的应用程序运行并缩小了图像的尺寸。MPEG解码器接收到数据流并以传统方式对其进行解码。特别地,由于对与缩放幅度和被缩放图像的位置相关的字段进行了填充,所以可以解码进行了缩放操作的图像,从而首先提供了一个重新构建的图像,它的大小在“horizontalsize”和“verticalsize”字段中指示。作为缩放幅度的一个功能,随后对这个重新构建的图像进行过采样或者下采样,随后被过滤,从而获得人们期望显示的图像的大小。作为与偏移相关的数据的功能,对图像(缩小)的位置或者被浏览的图像部分的选择进行计算。一个可以作为示范的应用程序是广告的插入。图像的尺寸被缩小以展示一些文字。另一个例子与节目指南有关。在已有技术中,浏览者从一个在编码器级别构建的队列中进行选择,而且通过跳过其它的视频服务(基本视频流)对图像进行选择。在本发明中,节目的选择触发了对应于被选择节目的MPEG数据流的应用程序的启动。随后在一个窗口中“实况”(实时的)显示被选择的频道。权利要求1.一种对按照MPEG2标准编码的图像执行缩放的编码方法,被缩放的图像由其对于被编码图像(1,7)的缩放率定义,其特征在于执行下面的步骤通过应用缩放率来计算初始显示长方形(8)的水平和垂直尺寸,从中可以获得按照轮廓和级别信息定义的目标显示长方形(2)的尺寸,在MPEG2比特流的“display_horizontal_size”和“display_vertical_size”字段中记录初始显示长方形的水平和垂直尺寸。2.根据权利要求1所述的方法,在缩小的情况下,被缩小的图像由它在被显示图像中的位置定义,在放大的情况下,被放大的图像由被显示的被编码图像的部分定义,其特征在于执行下面的步骤计算初始显示长方形(8)的中心对于被编码图像(7)的中心的相对位置,以定义水平和垂直偏移,在MPEG2视频数据流的frame_centre_horizontal_offset和frame_certre_vertical_offset字段中存储定义水平和垂直偏移的信息项。3.根据权利要求1所述的方法,其特征在于,在与期望执行缩放功能的图像相对应的MPEG2数据流的两个时间代码时刻tc0和tc1之间执行与数值在字段中的存储相对应的流的修改。4.一种用于执行根据权利要求2的编码方法的编码设备,其特征在于包括链接到MPEG2编码器(9)的语法修改器(12),用于修改源自编码器的M

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论