JP2015136059A - Communication device, communication data generation method, and communication data processing method - Google Patents
Communication device, communication data generation method, and communication data processing method Download PDFInfo
- Publication number
- JP2015136059A JP2015136059A JP2014006881A JP2014006881A JP2015136059A JP 2015136059 A JP2015136059 A JP 2015136059A JP 2014006881 A JP2014006881 A JP 2014006881A JP 2014006881 A JP2014006881 A JP 2014006881A JP 2015136059 A JP2015136059 A JP 2015136059A
- Authority
- JP
- Japan
- Prior art keywords
- packet
- data
- unit
- nal unit
- communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/23605—Creation or processing of packetized elementary streams [PES]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/643—Communication protocols
- H04N21/64322—IP
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/643—Communication protocols
- H04N21/6437—Real-time Transport Protocol [RTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8543—Content authoring using a description language, e.g. Multimedia and Hypermedia information coding Expert Group [MHEG], eXtensible Markup Language [XML]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
本開示は、通信装置、通信データ生成方法、および通信データ処理方法に関する。さらに詳細には例えば放送波やネットワークを介したデータの送信または受信を実行する通信装置、通信データ生成方法、および通信データ処理方法に関する。 The present disclosure relates to a communication device, a communication data generation method, and a communication data processing method. More specifically, for example, the present invention relates to a communication apparatus, a communication data generation method, and a communication data processing method that execute transmission or reception of data via broadcast waves or a network.
画像データや音声データ等のコンテンツを各通信事業者のサービス形態に関わらず配信可能としたデータ配信方式としてOTT(Over The Top)が知られている。OTTによる配信コンテンツはOTTコンテンツと呼ばれ、また、OTTを利用した画像(ビデオ)データの配信サービスはOTTビデオやOTT−V(Over The Top Video)と呼ばれる。 OTT (Over The Top) is known as a data distribution method that enables distribution of contents such as image data and audio data regardless of the service form of each communication carrier. The delivery content by OTT is called OTT content, and the delivery service of image (video) data using OTT is called OTT video and OTT-V (Over The Top Video).
例えばOTT−Vに従ったデータストリーミング配信の基盤技術としてDASH(Dynamic Adaptive Streaming overHTTP)が利用される。DASHは、HTTP(HyperText Transfer Protocol)プロトコルを使用したアダプティブ(適応型)ストリーミング技術の標準規格である。 For example, DASH (Dynamic Adaptive Streaming HTTP) is used as a basic technology for data streaming distribution according to OTT-V. DASH is a standard for adaptive streaming technology that uses the HyperText Transfer Protocol (HTTP) protocol.
アダプティブ(適応型)ストリーミングでは、コンテンツ配信サーバは様々なクライアントで配信コンテンツの再生を可能とするため、複数のビットレートの動画コンテンツの細分化ファイルとこれらの属性情報やURLを記述したマニフェスト・ファイルを作成し保持する。 In adaptive (adaptive) streaming, the content distribution server enables reproduction of distribution content by various clients. Therefore, a segmented file of moving image content of a plurality of bit rates, and a manifest file describing these attribute information and URL Create and hold
クライアントは、マニフェスト・ファイルをサーバから取得して、自装置の表示部のサイズや利用可能な通信帯域に応じた最適なビットレートコンテンツを選択し、選択コンテンツを受信して再生する。ネットワーク帯域の変動に応じてビットレートの動的な変更も可能であり、クライアント側では、状況に応じた最適なコンテンツを随時切り替えて受信することが可能となり、映像途切れの発生を低減した動画コンテンツ再生が実現される。なお、アダプティブ(適応型)ストリーミングについては、例えば特許文献1(特開2011−87103号公報)に記載がある。 The client acquires the manifest file from the server, selects the optimum bit rate content according to the size of the display unit of the own device and the available communication band, receives the selected content, and plays it. It is possible to dynamically change the bit rate according to fluctuations in the network bandwidth, and it is possible for the client side to switch and receive the optimal content according to the situation at any time, reducing the occurrence of video interruptions Playback is realized. Note that adaptive (adaptive) streaming is described in, for example, Japanese Patent Application Laid-Open No. 2011-87103.
MPEG(Moving Picture Expert Group)符号化された動画や音声データを上記のDASHに従ってストリーミング配信するための仕様を定めた規格としてMPEG−DASH規格がある。
MPEG−DASH規格には、以下の2つの規格が含まれる。
(a)動画や音声ファイルの管理情報であるメタデータを記述するためのマニフェスト・ファイル(MPD:Media Presentation Description)に関する規格。
(b)動画コンテンツ伝送用のファイル・フォーマット(セグメント・フォーマット)に関する規格。
MPEGデータをDASHに従ってストリーミング配信する場合は、このMPEG−DAH規格に従った処理が行われる。
The MPEG-DASH standard is a standard that defines the specifications for streaming distribution of moving picture and audio data encoded according to MPEG (Moving Picture Expert Group) according to the DASH.
The MPEG-DASH standard includes the following two standards.
(A) A standard relating to a manifest file (MPD: Media Presentation Description) for describing metadata that is management information of moving images and audio files.
(B) Standard relating to a file format (segment format) for moving image content transmission.
When MPEG data is streamed according to DASH, processing according to the MPEG-DAH standard is performed.
しかし、アダプティブ(適応型)ストリーミング技術の標準規格であるDASHは1対1の通信処理であるポイントトゥーポイント(Point−to−point)型のHTTPストリーミング技術をベースとしている。
このため、例えばスポーツ中継等、多数のクライアントが同時に視聴する可能性のあるコンテンツ(番組)のストリーミング配信に適用する場合にはCDN(Content Delivery Network)のサポートが必要となる。
However, DASH, which is a standard for adaptive (adaptive) streaming technology, is based on point-to-point HTTP streaming technology, which is a one-to-one communication process.
For this reason, when applying to streaming distribution of contents (programs) that many clients may view at the same time, such as sports broadcasts, it is necessary to support CDN (Content Delivery Network).
しかし、CDNを適用したポイントトゥーポイントのHTTPストリーミングを構築するにはコスト的な制約があり、放送配信に匹敵する程のスケーラビリティを実現することは困難である。上述したようにDASHはHTTPをベースのストリーミングプロトコルを利用しており、放送配信のように多数のクライアントが同時に視聴するコンテンツ配信には不向きであるという問題がある。 However, there is a cost limitation in constructing point-to-point HTTP streaming using CDN, and it is difficult to realize scalability comparable to broadcast distribution. As described above, DASH uses a streaming protocol based on HTTP, and has a problem that it is not suitable for content distribution that many clients view simultaneously, such as broadcast distribution.
本開示は、HTTPをベースとするストリーミングプロトコルを利用したコンテンツ配信において、同時に多数のクライアントにコンテンツを提供し、各クライアントにおいて遅延の少ないリアルタイム再生を実現する通信装置、通信データ生成方法、および通信データ処理方法を提供することを目的とする。 The present disclosure provides a communication device, a communication data generation method, and communication data that simultaneously provide content to a large number of clients in content distribution using a streaming protocol based on HTTP, and realize real-time reproduction with little delay in each client. An object is to provide a processing method.
本開示の第1の側面は、
符号化データを格納したパケットを生成するデータ処理部と、
前記データ処理部の生成したパケットを送信する通信部を有し、
前記データ処理部は、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットを生成し、
パケットに対する付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報を設定したパケットを生成して前記通信部を介して送信する通信装置にある。
The first aspect of the present disclosure is:
A data processing unit for generating a packet storing encoded data;
A communication unit that transmits the packet generated by the data processing unit;
The data processing unit
Generate a packet that stores a NAL unit that constitutes a GOP (Group of Pictures), which is a processing unit of encoded data, or a NAL unit fragment obtained by further dividing the NAL unit,
As the additional information for the packet, the communication is performed by generating a packet in which access point information indicating whether the NAL unit stored in the packet or the NAL unit that is the division source of the NAL unit fragment includes data to be a random access point is set. In the communication device that transmits via the unit.
さらに、本開示の通信装置の一実施態様において、前記アクセスポイント情報は、パケット格納データが、SAP(Streeming Access Point)によって指定される符号化データを含むNALユニットに基づいて生成されたデータであるか否かを示す情報である。 Furthermore, in an embodiment of the communication apparatus according to the present disclosure, the access point information is data generated based on a NAL unit in which packet storage data includes encoded data specified by SAP (Streaming Access Point). It is information indicating whether or not.
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、GOPの構成データであるNALユニットを1つ以上含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成する。 Furthermore, in an embodiment of the communication apparatus according to the present disclosure, the data processing unit includes a sub GOP media segment storing media data including one or more NAL units that are GOP configuration data and metadata corresponding to the media data. Are generated as packet storage data.
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、GOPを構成するNALユニットをさらに分割したNALユニットフラグメントを生成して、NALユニットフラグメントを格納した複数のパケットと、前記NALユニットに対応するメタデータを格納したパケットを生成する。 Furthermore, in an embodiment of the communication device according to the present disclosure, the data processing unit generates a NAL unit fragment obtained by further dividing a NAL unit that constitutes a GOP, and stores a plurality of packets storing the NAL unit fragment, and the NAL A packet storing metadata corresponding to the unit is generated.
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、送信対象の符号化データを、通信経路上で規定される最大データ転送単位(MTU:Maximum Transfer Unit)以下のデータに分割して生成した分割データを格納したパケットを生成する。 Furthermore, in an embodiment of the communication device according to the present disclosure, the data processing unit divides the encoded data to be transmitted into data equal to or less than a maximum data transfer unit (MTU) defined on the communication path. A packet storing the generated divided data is generated.
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、HTTPパケットを生成し、前記付加情報を生成パケット内のHTTPヘッダに記録する。 Furthermore, in an embodiment of the communication device according to the present disclosure, the data processing unit generates an HTTP packet and records the additional information in an HTTP header in the generated packet.
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、前記付加情報を生成パケット内の拡張ヘッダに記録する。 Furthermore, in an embodiment of the communication device according to the present disclosure, the data processing unit records the additional information in an extension header in a generated packet.
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、前記付加情報を生成パケット内のLCTヘッダに記録する。 Furthermore, in an embodiment of the communication device according to the present disclosure, the data processing unit records the additional information in an LCT header in a generated packet.
さらに、本開示の通信装置の一実施態様において、前記通信部は、前記データ処理部の生成したパケットを、放送波を介してブロードキャスト配信、またはマルチキャスト配信する。 Furthermore, in an embodiment of the communication device according to the present disclosure, the communication unit broadcasts or multicasts a packet generated by the data processing unit via a broadcast wave.
さらに、本開示の第2の側面は、
送信装置が送信した符号化データ格納パケットを受信する通信部と、
前記通信部の受信したパケットを入力して処理を実行するデータ処理部を有し、
前記通信部の受信する前記符号化データ格納パケットの各々は、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットであり、付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報が設定されたパケットである通信装置にある。
Furthermore, the second aspect of the present disclosure is:
A communication unit that receives the encoded data storage packet transmitted by the transmission device; and
A data processing unit that inputs a packet received by the communication unit and executes processing;
Each of the encoded data storage packets received by the communication unit is:
A packet that stores a NAL unit that constitutes a GOP (Group of Pictures) that is a processing unit of encoded data, or a NAL unit fragment that is a further division of the NAL unit. As additional information, the NAL unit or NAL stored in the packet The communication apparatus is a packet in which access point information indicating whether or not a NAL unit that is a unit fragment division source includes data to be a random access point is set.
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、受信パケットに記録された付加情報である前記アクセスポイント情報を参照して、受信パケットに格納されたデータが、SAP(Streeming Access Point)によって指定される符号化データを含むNALユニットに基づいて生成されたデータであるか否かを判定する処理を実行する。 Furthermore, in an embodiment of the communication device according to the present disclosure, the data processing unit refers to the access point information that is additional information recorded in the received packet, and the data stored in the received packet is converted to SAP (Streaming). A process for determining whether or not the data is generated based on the NAL unit including the encoded data specified by (Access Point) is executed.
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、受信パケットに記録された付加情報である前記アクセスポイント情報を参照して、アクセスポイントを含むデータを選択取得して、復号、再生処理を実行する。 Furthermore, in an embodiment of the communication device according to the present disclosure, the data processing unit refers to the access point information that is additional information recorded in the received packet, and selectively acquires and decodes data including the access point. Execute playback process.
さらに、本開示の通信装置の一実施態様において、前記通信部は、前記付加情報をHTTPヘッダに記録したHTTPパケットを受信し、前記データ処理部は、受信パケットのHTTPヘッダから前記付加情報を取得する。 Furthermore, in one embodiment of the communication device according to the present disclosure, the communication unit receives an HTTP packet in which the additional information is recorded in an HTTP header, and the data processing unit acquires the additional information from the HTTP header of the received packet. To do.
さらに、本開示の通信装置の一実施態様において、前記通信部は、前記付加情報を拡張ヘッダに記録したパケットを受信し、前記データ処理部は、受信パケットの拡張ヘッダから前記付加情報を取得する。 Furthermore, in an embodiment of the communication device according to the present disclosure, the communication unit receives a packet in which the additional information is recorded in an extension header, and the data processing unit acquires the additional information from the extension header of the received packet. .
さらに、本開示の通信装置の一実施態様において、前記通信部は、前記付加情報をLCTヘッダに記録したパケットを受信し、前記データ処理部は、受信パケットのLCTヘッダから前記付加情報を取得する。 Furthermore, in an embodiment of the communication device according to the present disclosure, the communication unit receives a packet in which the additional information is recorded in an LCT header, and the data processing unit acquires the additional information from the LCT header of the received packet. .
さらに、本開示の通信装置の一実施態様において、前記通信部は、前記パケットを、放送波を介して受信する。 Furthermore, in an embodiment of the communication device according to the present disclosure, the communication unit receives the packet via a broadcast wave.
さらに、本開示の第3の側面は、
データ送信装置において実行する通信データ生成方法であり、
データ処理部が、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットを生成し、
パケットに対する付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報を設定したパケットを生成して通信部を介して送信する通信データ生成方法にある。
Furthermore, the third aspect of the present disclosure is:
A communication data generation method executed in a data transmission device,
The data processor
Generate a packet that stores a NAL unit that constitutes a GOP (Group of Pictures), which is a processing unit of encoded data, or a NAL unit fragment obtained by further dividing the NAL unit,
As a supplementary information for the packet, a communication unit is generated by generating a packet in which access point information indicating whether or not the NAL unit stored in the packet or the NAL unit that is the division source of the NAL unit fragment includes data serving as a random access point is set. In the communication data generation method to be transmitted via
さらに、本開示の第4の側面は、
データ受信装置において実行する通信データ処理方法であり、
通信部が、送信装置が送信した符号化データ格納パケットを受信するステップと、
データ処理部が、前記通信部の受信したパケットを入力して処理を実行するデータ処理ステップを実行し、
前記通信部の受信する前記符号化データ格納パケットの各々は、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットであり、付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報が設定されたパケットであり、
前記データ処理ステップは、前記通信部の受信したアクセスポイント情報が設定されたパケットを入力して処理を実行するステップである通信データ処理方法にある。
Furthermore, the fourth aspect of the present disclosure is:
A communication data processing method executed in a data receiving device,
A communication unit receiving an encoded data storage packet transmitted by a transmission device;
A data processing unit executes a data processing step of inputting a packet received by the communication unit and executing a process,
Each of the encoded data storage packets received by the communication unit is:
A packet that stores a NAL unit that constitutes a GOP (Group of Pictures) that is a processing unit of encoded data, or a NAL unit fragment that is a further division of the NAL unit. As additional information, the NAL unit or NAL stored in the packet A packet in which access point information indicating whether or not the NAL unit that is the source of the unit fragment includes data to be a random access point is set,
The data processing step is a communication data processing method which is a step of executing a process by inputting a packet in which access point information received by the communication unit is set.
本開示のさらに他の目的、特徴や利点は、後述する本開示の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 Other objects, features, and advantages of the present disclosure will become apparent from a more detailed description based on embodiments of the present disclosure described below and the accompanying drawings. In this specification, the system is a logical set configuration of a plurality of devices, and is not limited to one in which the devices of each configuration are in the same casing.
本開示の一実施例の構成によれば、通信パケットの格納符号化データが、ランダムアクセス可能な符号化データに基づくデータであるか否かをパケット単位で判別可能とした構成が実現される。
具体的には、送信装置が、符号化データの構成要素であるNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットを生成し、付加情報として、パケット格納データの元データであるNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報を設定して送信する。受信装置はパケット付加情報を参照してパケット格納データが、ランダムアクセス可能な符号化データに基づいて生成されたデータであるか否かを判別する。
本構成により、通信パケットの格納符号化データが、ランダムアクセス可能な符号化データに基づくデータであるか否かをパケット単位で判別可能とした構成が実現される。
なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。
According to the configuration of an embodiment of the present disclosure, a configuration is realized in which it is possible to determine whether or not the stored encoded data of a communication packet is data based on encoded data that can be accessed randomly.
Specifically, the transmission device generates a packet storing a NAL unit that is a component of encoded data or a NAL unit fragment obtained by further dividing the NAL unit, and is the original data of the packet storage data as additional information Access point information indicating whether or not the NAL unit includes data to be a random access point is set and transmitted. The receiving apparatus refers to the packet additional information to determine whether or not the packet storage data is data generated based on randomly accessible encoded data.
With this configuration, it is possible to realize a configuration in which it is possible to determine whether or not the stored encoded data of the communication packet is data based on randomly accessible encoded data for each packet.
Note that the effects described in the present specification are merely examples and are not limited, and may have additional effects.
以下、図面を参照しながら本開示の通信装置、通信データ生成方法、および通信データ処理方法の詳細について説明する。なお、説明は以下の項目に従って行なう。
1.通信システムの構成例について
2.一斉同時配信型のコンテンツ配信における問題点について
3.送信データの細分化処理構成について
4.HTTPヘッダに付加情報を記録した実施例について
5.パケットの構成について
6.送信装置と受信装置の構成と処理について
7.パケットに格納したNALユニットがSAP(ストリームアクセスポイント)を含むか否かを識別可能としたアクセスポイント情報を付加した構成について
8.NALユニットをさらに分割したNALユニットフラグメント格納パケットを利用した通信処理構成について
9.送信装置と受信装置の処理シーケンスについて
10.拡張ヘッダに付加情報を記録した実施例について
11.LCTヘッダに付加情報を記録した実施例について
12.HEVC符号化データに対する適用例について
13.各装置のハードウェア構成例について
14.本開示の構成のまとめ
Hereinafter, details of the communication device, the communication data generation method, and the communication data processing method of the present disclosure will be described with reference to the drawings. The description will be made according to the following items.
1. 1. Configuration example of
[1.通信システムの構成例について]
まず、図1を参照して本開示の処理を実行する通信システムの一構成例について説明する。
図1に示すように、通信システム10は、画像データや音声データ等のコンテンツを送信する通信装置である送信装置20と、送信装置20の送信コンテンツを受信する通信装置である受信装置30を有する。
[1. Communication system configuration example]
First, a configuration example of a communication system that executes the processing of the present disclosure will be described with reference to FIG.
As illustrated in FIG. 1, the communication system 10 includes a
送信装置20は、具体的には、例えば放送局21やコンテンツサーバ22等、コンテンツを提供する側の装置である。
一方、受信装置30は、一般ユーザのクライアント装置であり、具体的には、例えばテレビ31、PC32、携帯端末33等によって構成される。
Specifically, the
On the other hand, the receiving
送信装置20と受信装置30間のデータ通信は、インターネット等のネットワークを介した双方向通信、あるいは、放送波等による一方向通信の少なくともいずれか、あるいは両者を利用した通信として行われる。
Data communication between the
送信装置20から受信装置30に対するコンテンツ送信は、アダプティブ(適応型)ストリーミング技術の規格であるMPEG−DASH規格に従って実行する。
先に説明したように、MPEG−DASH規格には、以下の2つの規格が含まれる。
(a)動画や音声ファイルの管理情報であるメタデータを記述するためのマニフェスト・ファイル(MPD:Media Presentation Description)に関する規格、
(b)動画コンテンツ伝送用のファイル・フォーマット(セグメント・フォーマット)に関する規格、
送信装置20から、受信装置30に対するコンテンツ配信は、上記のMPEG−DASH規格に従って実行する。
Content transmission from the
As described above, the MPEG-DASH standard includes the following two standards.
(A) a standard concerning a manifest file (MPD: Media Presentation Description) for describing metadata that is management information of a moving image or an audio file;
(B) Standards related to file format (segment format) for video content transmission;
Content distribution from the
送信装置20は、コンテンツデータを符号化し、符号化データおよび符号化データのメタデータを含むデータファイルを生成する。符号化処理は、例えばMPEGにおいて規定されるMP4ファイルフォーマットに従って行われる。なお、送信装置20がMP4形式のデータファイルを生成する場合の符号化データのファイルは「mdat」、メタデータは「moov」や「moof」等と呼ばれる。
これらの符号化データの詳細については後段で説明する。
The
Details of these encoded data will be described later.
送信装置20が受信装置30に提供するコンテンツは、例えば音楽データや、映画、テレビ番組、ビデオ、写真、文書、絵画および図表などの映像データや、ゲームおよびソフトウェアなど、様々なデータである。
The content provided by the
送信装置20の送信データについて図2を参照して説明する。
MPEG−DASH規格に従ってデータ送信を実行する送信装置20は、図2に示すように、初期化セグメント(Initialization Segment)50と、メディアセグメント(Media Segment)60を、それぞれパケットに格納して受信装置30に送信する。これらの各セグメントはDASHセグメントと呼ばれる。
Transmission data of the
As shown in FIG. 2, the
メディアセグメント60各々はMPEG符号化されたコンテンツデータを分割して格納したセグメントである。
初期化セグメント50はメディアセグメント60の格納コンテンツを受信装置30側で再生する場合に必要となる初期設定情報、例えばコーデックの設定情報などを格納したセグメントである。
なお、送信装置20は、例えば1つの映画や番組等のコンテンツを、多数のメディアセグメント60に分割格納して順次送信する。
Each of the
The
Note that the
送信装置20は、図2に示す初期化セグメント50、メディアセグメント60をHTTPパケットに格納し、さらに、HTTPパケットを格納したIPパケットを生成して送信する。送信パケットの構成の詳細については後段で説明する。
The transmitting
図2に示す受信装置30は、まず、1つの初期化セグメント50を受信し、初期化セグメントに格納された設定情報に従ってコーデック等の設定処理等を実行する。続いて、メディアセグメント60を順次、受信し、再生順に従ってデコードを行なって再生処理を行なう。
The receiving
[2.一斉同時配信型のコンテンツ配信における問題点について]
前述したように、アダプティブ(適応型)ストリーミング技術の標準規格であるDASHはポイントトゥーポイントのHTTPストリーミングをベースとしており、多数のクライアントが同時に視聴する一斉同時配信型コンテンツの配信には向かないという問題がある。
しかし、マルチキャストやブロードキャスト(MC/BC)を併用することで、コンテンツを同時に多数のクライアント(受信装置)に遅延なく提供することが可能であると考えられる。
[2. Problems in simultaneous simultaneous content distribution]
As described above, DASH, which is a standard for adaptive streaming technology, is based on point-to-point HTTP streaming, and is not suitable for the simultaneous distribution of content that many clients view simultaneously. There is.
However, it is considered that content can be simultaneously provided to a large number of clients (reception devices) without delay by using multicast and broadcast (MC / BC) together.
マルチキャストやブロードキャスト(MC/BC)型のストリーミングに適用可能なトランスポートプロトコルには、例えばRTP(Real−time Transport Protocol)やFLUTE(File Delivery over Uni−directional Transport)がある。 Transport protocols applicable to multicast and broadcast (MC / BC) type streaming include, for example, RTP (Real-time Transport Protocol) and FLUTE (File Delivery over Uni-directional Transport).
図3を参照して、FLUTEプロトコルを利用してHTTPストリーミングベースのDASH規格に従ってコンテンツストリーム配信を行う場合に利用可能なDASHセグメントの構成例について説明する。 A configuration example of a DASH segment that can be used when content stream distribution is performed in accordance with the HTTP streaming-based DASH standard using the FLUTE protocol will be described with reference to FIG.
先に図2を参照して説明したように、DASHセグメントは、
(a)初期化セグメント(Initialization Segment)、
(b)メディアセグメント(Media Segment)、
これらの2種類に分けられる。
As described above with reference to FIG. 2, the DASH segment is
(A) Initialization segment (Initialization Segment),
(B) Media segment,
There are two types.
(a)初期化セグメント(Initialization Segment)は、受信装置30におけるデコーダの設定等、コンテンツ再生を実行するために必要となる設定情報等の初期化データを格納したセグメントである。
(b)メディアセグメント(Media Segment)は、再生対象となる符号化コンテンツを格納したセグメントである。
(A) The initialization segment (initialization segment) is a segment that stores initialization data such as setting information necessary for executing content reproduction, such as setting of a decoder in the receiving
(B) A media segment is a segment that stores encoded content to be reproduced.
図3に示すように(a)初期化セグメントは、以下の各情報を含む。
(a1)セグメントのファイルタイプ情報等からなるヘッダ情報(dash)、
(a2)メディアセグメントによって送信する符号化コンテンツであるメディアデータ(mdat)のコーデック(符号化態様)情報等の初期化情報を含むメタデータ(moov)、
As shown in FIG. 3, (a) the initialization segment includes the following pieces of information.
(A1) Header information (dash) including segment file type information, etc.
(A2) metadata (moov) including initialization information such as codec (encoding mode) information of media data (mdat) that is encoded content transmitted by the media segment;
一方、(b)メディアセグメントは、図3に示すように以下の各情報を含む。
(b1)セグメントのファイルタイプ情報等からなるヘッダ情報(msdh)、
(b2)メディアセグメントに格納された複数のサブセグメント(Sub−Segment)の境界情報や、メディアセグメントに格納された符号化コンテンツであるメディアデータ(mdat)のランダムアクセスポイント等を示すアクセス情報(sidx)、
(b3)複数のサブセグメント(Sub−Segment)70、
On the other hand, the (b) media segment includes the following pieces of information as shown in FIG.
(B1) Header information (msdh) including segment file type information, etc.
(B2) Access information (sidx) indicating boundary information of a plurality of sub-segments (Sub-Segment) stored in the media segment, random access points of media data (mdat) that is encoded content stored in the media segment, etc. ),
(B3) A plurality of sub-segments (Sub-Segment) 70,
また、複数のサブセグメント(Sub−Segment)70は1つまたは複数のフラグメント(Fragment)80で構成される。
フラグメント(Fragment)80は、以下の各データを含む。
再生対象となる符号化コンテンツであるメディアデータ(mdat)、
メディアデータ(mdat)に対応するメタデータ(moof)。
In addition, the plurality of sub-segments (Sub-Segment) 70 includes one or a plurality of fragments (Fragments) 80.
The fragment 80 includes the following data.
Media data (mdat) that is encoded content to be played back,
Metadata (moof) corresponding to media data (mdat).
なお、(b)メディアセグメントのアクセス情報(sidx)に記録されるランダムアクセスポイントは、DASHではSAP(Stream Access Point)と呼ばれる。
SAPは、例えばストリームを復号するために必要なすべての状態をリセットすることができる画像シーケンスの先頭ピクチャの先頭バイト位置を示す。具体的には、例えばMPEGデータのIピクチャの位置等を示す情報である。
Note that (b) a random access point recorded in the access information (sidx) of the media segment is called SAP (Stream Access Point) in DASH.
The SAP indicates the start byte position of the start picture of the image sequence that can reset all the states necessary for decoding the stream, for example. Specifically, it is information indicating the position of an I picture of MPEG data, for example.
フラグメント(Fragment)80に格納するメディアデータ(mdat)対応のメタデータ(moof)には、例えばフラグメント格納メディアデータ(mdat)の再生時間情報としてのプレゼンテーションタイム等が記録される。 In the metadata (moof) corresponding to the media data (mdat) stored in the fragment 80, for example, a presentation time or the like as the playback time information of the fragment storage media data (mdat) is recorded.
1つのフラグメント80に格納するメディアデータ(mdat)は、現行では、通常、DASHの制御対象となるコンテンツストリームの処理単位(チャンク)に設定される。処理単位(チャンク)とは、例えばMPEG(Moving Picture Expert Group)符号化の処理単位であるGOP(Group of Pictures)である。
なお、GOPは再生時間が約0.5〜2秒程度のデータに設定して運用している場合が多い。
Currently, the media data (mdat) stored in one fragment 80 is normally set in a processing unit (chunk) of a content stream to be controlled by DASH. The processing unit (chunk) is, for example, GOP (Group of Pictures) which is a processing unit of MPEG (Moving Picture Expert Group) encoding.
In many cases, the GOP is operated by setting data with a reproduction time of about 0.5 to 2 seconds.
しかし、1つのフラグメント80に格納するメディアデータ(mdat)を1つのGOP単位のデータとすると、データ配信や再生処理における遅延が発生し、リアルタイム再生に支障が発生する可能性がある。
例えば、ライブ中継画像を配信する場合、送信装置20は、カメラから入力するライブ画像データの符号化処理を実行してメディアセグメント60を順次生成する。メディアセグメント60の各フラグメント80に格納するメディアデータ(mdat)がGOP単位の符号化データである場合、送信装置30は、GOP単位の符号化データであるメディアデータ(mdat)を生成し、その後、生成したメディアデータ(mdat)のプレゼンテーションタイム等の属性情報を記述したメタデータ(moof)を生成することになる。
However, if the media data (mdat) stored in one fragment 80 is data of one GOP unit, a delay in data distribution and reproduction processing may occur, and real-time reproduction may be hindered.
For example, when a live relay image is distributed, the
従って、このシーケンスで各データの生成を行うと、各GOP単位の符号化データのデータ範囲が決定された後でないと、そのGOPのメタデータ(moof)の生成ができない。
従って、メタデータ(moof)の生成は、メディアデータ(mdat)のデータ範囲が決定後に行うことになり、各メタデータ(moof)の生成処理は、1つのGOP単位の時間(0.5〜2秒)に相当する時間を待って行わざる得ないことになる。
Therefore, if each data is generated in this sequence, the GOP metadata (moof) can be generated only after the data range of the encoded data of each GOP unit is determined.
Therefore, the generation of the metadata (moof) is performed after the data range of the media data (mdat) is determined, and the generation process of each metadata (moof) is performed in one GOP unit time (0.5 to 2). It is necessary to wait for a time equivalent to (second).
メディアセグメント60を構成するフラグメント80に格納するメディアデータ(mdat)をGOP単位の符号化データとした場合のフラグメント生成シーケンスについて図4を参照して説明する。
A fragment generation sequence when media data (mdat) stored in the fragment 80 constituting the
なお、図4に示す例は、メディアセグメント60に格納するメディアデータ(mdat)をMPEGにおいて規定されるMP4ファイルフォーマット(符号化形式)に従って格納する場合のシーケンス例である。
MP4ファイルフォーマットのデータ部は、基本格納単位としてのサンプル(sample)に区分される。さらに各サンプル(sample)は、1以上のNALユニットによって構成される。NALユニットは、MPEG符号化データの例えばスライス単位の細分化データである。
図4(a)に示すように複数の1つのGOPに対応する符号化データは複数のNALユニットによって構成される。
The example shown in FIG. 4 is a sequence example when the media data (mdat) stored in the
The data portion of the MP4 file format is divided into samples as basic storage units. Further, each sample is composed of one or more NAL units. The NAL unit is fragmented data of MPEG encoded data, for example, in units of slices.
As shown in FIG. 4A, encoded data corresponding to a plurality of GOPs is composed of a plurality of NAL units.
図4には、
上段に(a)GOPを構成するNALユニット
下段に(b)フラグメント生成処理シーケンス
これらを示している。
(b)フラグメント生成処理シーケンスの最下段には時間軸を示している。左から右に時間が経過し、送信装置20は、この時間軸に従って、各処理を実行してフラグメントを生成する。
なお、送信装置は、生成したフラグメントを格納したメディアセグメントを生成し、その後、メディアセグメントを格納したHTTPパケットを生成し、さらにHTTPパケットを格納したIPパケットを生成した後、IPパケットの送信を行う。
In FIG.
The upper row (a) NAL units that constitute the GOP. The lower row (b) shows the fragment generation processing sequence.
(B) The time axis is shown at the bottom of the fragment generation processing sequence. Time elapses from left to right, and the
The transmission device generates a media segment storing the generated fragment, generates an HTTP packet storing the media segment, generates an IP packet storing the HTTP packet, and then transmits the IP packet. .
図4(b)に示すフラグメント生成処理シーケンスについて説明する。
送信装置20は、以下のシーケンスでMP4ファイルフォーマットに従った符号化データを格納したフラグメントを生成する。
時間t0〜t1:GOPを構成する複数のNALユニットを格納したサンプル1(sample1)を生成、
時間t2〜t3:GOPを構成する複数のNALユニットを格納したサンプル2(sample2)を生成、
時間t4〜t5:GOPを構成する複数のNALユニットを格納したサンプル3(sample3)を生成、
ここまでで、1GOPを構成する全てのNALユニットを格納したサンプルの生成が完了する。
これらのサンプル1〜3(sample1〜3)がメディアセグメントのフラグメント内のメディアデータ(mdat)として設定されることになる。
The fragment generation processing sequence shown in FIG.
The
Time t0 to t1: Sample 1 (sample1) storing a plurality of NAL units constituting the GOP is generated.
Time t2 to t3: Sample 2 (sample2) storing a plurality of NAL units constituting the GOP is generated.
Time t4 to t5: Sample 3 (sample3) storing a plurality of NAL units constituting the GOP is generated.
Up to this point, the generation of the sample storing all the NAL units constituting one GOP is completed.
These
時間t6〜t7:サンプル1〜3(sample1〜3)に格納したGOP符号化データの属性情報であるメタデータ(moof)を生成する。
時間t8〜t9:サンプル1〜3(sample1〜3)によって構成されるメディアデータ(mdat)と、サンプル1〜3(sample1〜3)のメタデータ(moof)を組み合わせたフラグメントを生成する。
Time t6 to t7: Metadata (moof) that is attribute information of GOP encoded data stored in
Time t8 to t9: A fragment is generated by combining media data (mdat) composed of
送信装置20は、その後、上述した処理に従って生成したフラグメントを含むメディアセグメントを生成し、メディアセグメントをペイロードとして含むパケットを生成して受信装置30に送信することになる。
送信装置20は、フラグメントを生成する場合、フラグメントに格納するGOP単位のメディアデータ(mdat)の再生時間等を確認し、その再生時間に応じたプレゼンテータションタイム等、GOPデータ単位の属性情報を生成して、メタデータ(moof)に記録する必要がある。
Thereafter, the
When generating a fragment, the
現在、データ配信される画像データは主にハイビジョン対応の画像データであるが、今後、さらに高画質化が進み、例えば4K画像等、データ量の多いデータ配信が増加すると予想される。このような大容量のデータ配信に対応するためストリームのビットレートが大きくなる可能性がある。 Currently, image data to be distributed is mainly high-definition image data. However, in the future, it is expected that image quality will be further improved and data distribution with a large amount of data such as 4K images will increase. There is a possibility that the bit rate of the stream becomes large in order to cope with such large volume data distribution.
高画質化によるデータ量の増大に従って各GOP単位のデータ量も増大する。従って、図4を参照して説明したように1つのGOP単位のフラグメントを順次、生成して送信する構成とすると、送信側での処理間隔が長くなる。また、送信データの単位当たりデータ量も大きくなる。従って、十分な通信帯域が確保できない場合、ネットワーク送信における送信遅延の発生可能性が増加する。 The amount of data for each GOP unit increases as the amount of data increases due to higher image quality. Therefore, as described with reference to FIG. 4, when one GOP unit fragment is generated and transmitted sequentially, the processing interval on the transmission side becomes long. In addition, the amount of data per unit of transmission data increases. Therefore, when a sufficient communication band cannot be secured, the possibility of transmission delay in network transmission increases.
また、受信装置側でのパケット受信間隔が長くなり、1パケットあたりのデータ受信量が増加し、受信装置側に要求されるデータバッファ量も増加する。また、パケットの受信エラーが発生した場合の再送処理を行なうと、遅延量が急激に大きくなり、リアルタイム再生が破たんする可能性が高くなる。 Further, the packet reception interval on the receiving device side becomes longer, the amount of data received per packet increases, and the amount of data buffer required on the receiving device side also increases. Also, if retransmission processing is performed when a packet reception error occurs, the amount of delay increases rapidly, and there is a high possibility that real-time reproduction will break.
[3.送信データの細分化処理構成について]
上記の問題を解決するため、送信装置20から受信装置30に対する送信データを細分化し、1つの送信パケット、すなわち一単位あたりの送信データ量を削減した構成例について、以下説明する。
[3. Transmission data segmentation processing configuration]
In order to solve the above problem, a configuration example in which transmission data from the
図4を参照したフラグメント生成シーケンスにおいては、フラグメントに設定するメディアデータ(mdat)を1GOP単位のデータとし、この1GOP単位のメディアデータ(mdat)に対応するメタデータ(moof)を生成する構成としていた。すなわち、各メタデータ(moof)を、1GOP単位のメディアデータ(mdat)に対応したメタデータとしていた。 In the fragment generation sequence with reference to FIG. 4, the media data (mdat) to be set in the fragment is set as 1 GOP unit data, and the metadata (moof) corresponding to the 1 GOP unit media data (mdat) is generated. . That is, each metadata (moof) is metadata corresponding to media data (mdat) in units of 1 GOP.
図4に示すシーケンスでは、メタデータ(moof)の生成タイミングは、1つのGOPのデータ量に応じて決定されてしまう。従って1GOPに含まれるデータ量が多くなると、メタデータ(moof)の生成タイミングも遅れ、その結果、フラグメントの生成処理、メディアセグメントの生成処理、送信パケットの生成処理にも遅れが発生する。また、この結果1パケット当たりのデータ量が増加し、配信遅延の可能性を高めてしまうことになる。 In the sequence shown in FIG. 4, the generation timing of metadata (moof) is determined according to the data amount of one GOP. Accordingly, when the amount of data included in one GOP increases, the generation timing of metadata (moof) is also delayed, and as a result, a delay occurs in fragment generation processing, media segment generation processing, and transmission packet generation processing. As a result, the amount of data per packet increases and the possibility of delivery delay increases.
このような事態を防止する構成として、フラグメント内のメディアデータ(mdat)を1GOP単位のデータではなく、1GOPを細分化したデータに設定した構成例について、図5を参照して説明する As a configuration for preventing such a situation, a configuration example in which media data (mdat) in a fragment is set to data obtained by subdividing 1 GOP instead of 1 GOP unit data will be described with reference to FIG.
図5には、フラグメントに格納するメディアデータ(mdat)を1つのGOPデータではなく、1つのGOPデータを細分化したデータ、具体的には1つのGOPの構成データである1つのNALユニットまたは複数のNALユニットとした例を示している。 In FIG. 5, media data (mdat) stored in a fragment is not one GOP data but data obtained by subdividing one GOP data, specifically, one NAL unit or a plurality of pieces of data constituting one GOP. An example of a NAL unit is shown.
図5(a)は、図4(a)と同様、GOPを構成するNALユニットを示している。
図5(b1)〜(b3)は、この1つのGOPの構成データであるNALユニットをメディアデータ(mdat)として分散させて格納した複数のメディアセグメントである。
図5(b1)〜(b3)に示すようにGOPデータを細分化データである1以上のNALユニットから構成されるメディアデータ(mdat)を格納したメディアセグメントを、以下、サブGOPメディアセグメントと呼ぶ。
FIG. 5 (a) shows the NAL units constituting the GOP, as in FIG. 4 (a).
FIGS. 5B1 to 5B3 show a plurality of media segments in which NAL units that are constituent data of one GOP are distributed and stored as media data (mdat).
As shown in FIGS. 5 (b1) to (b3), a media segment storing media data (mdat) composed of one or more NAL units, which are subdivided data of GOP data, is hereinafter referred to as a sub GOP media segment. .
図5には、1つのGOPデータを3つのサブGOPメディアセグメントに格納した例を示しているが、1つのGOPデータを格納するためのサブGOPメディアセグメントの数は、2以上の任意数に設定可能である。
また、図5(b1)〜(b3)のサブGOPメディアセグメントは、いずれもメディアデータ(mdat)を複数のNALユニットに設定した例としているが、メディアデータ(mdat)を1つのNALユニットのみの設定としてもよい。
FIG. 5 shows an example in which one GOP data is stored in three sub GOP media segments, but the number of sub GOP media segments for storing one GOP data is set to an arbitrary number of 2 or more. Is possible.
In addition, the sub GOP media segments in FIGS. 5B1 to 5B3 are all examples in which media data (mdat) is set in a plurality of NAL units, but the media data (mdat) is only one NAL unit. It is good also as a setting.
送信装置20は、図5(b1)〜(b3)に示すサブGOPメディアセグメントを生成し、生成したサブGOPメディアセグメントの各々を、それぞれ個別のHTTPパケットのペイロードに設定してネットワークや放送波を介して送信する。
The
図5(b1)〜(b3)のサブGOPメディアセグメントに格納するメタデータ(moof)は、個々のサブGOPメディアセグメントに格納するメディアデータ(mdat)に対応した属性情報からなるメタデータとする。
このような設定とすることで、ネットワークや放送波を介して送信される1つのパケットのデータ量が小さくなり、送信装置側の1つのパケット生成処理に要する時間が短縮される。またパケット遅延の可能性も低減し、パケットロス等の際の再送処理遅延も小さくなる。結果として、受信装置30におけるエラーのないリアルタイム再生が実現される。
The metadata (moof) stored in the sub GOP media segment in FIGS. 5B1 to 5B3 is metadata including attribute information corresponding to the media data (mdat) stored in each sub GOP media segment.
With this setting, the data amount of one packet transmitted via the network or broadcast wave is reduced, and the time required for one packet generation process on the transmission device side is shortened. In addition, the possibility of packet delay is reduced, and the retransmission processing delay in the event of packet loss or the like is also reduced. As a result, real-time reproduction without error in the receiving
サブGOPメディアセグメントにHTTPヘッダを設定したHTTPパケットの構成例について、図6を参照して説明する。
図6には2つのHTTPパケット構成例を示している。
図6の(a)と(b)に示すパケットの差異は、ランダムアクセス情報等を格納する[sidx]を有するか否かである。
sidxは、先に図3を参照して説明したように、メディアセグメントに格納された複数のサブセグメント(Sub−Segment)の境界情報や、メディアセグメントに格納された符号化コンテンツであるメディアデータ(mdat)のランダムアクセスポイント等を示すアクセス情報である。DASHではアクセス情報はSAP(Stream Access Point)と呼ばれる。SAPは、例えばストリームを復号するために必要なすべての状態をリセットすることができる画像シーケンスの先頭ピクチャの先頭バイト位置を示す。具体的には、例えばMPEGデータのIピクチャ位置に相当する。
A configuration example of an HTTP packet in which an HTTP header is set in a sub GOP media segment will be described with reference to FIG.
FIG. 6 shows two HTTP packet configuration examples.
The difference between the packets shown in FIGS. 6A and 6B is whether or not the packet has [sidx] for storing random access information and the like.
As described above with reference to FIG. 3, sidx is boundary information of a plurality of sub-segments (Sub-Segment) stored in the media segment, and media data (encoded content stored in the media segment ( mdat) random access point or the like. In DASH, the access information is called SAP (Stream Access Point). The SAP indicates the start byte position of the start picture of the image sequence that can reset all the states necessary for decoding the stream, for example. Specifically, for example, it corresponds to an I picture position of MPEG data.
図6(b)に示すHTTPパケットは、sidxを含まないパケットである。図6(b)に示すHTTPパケットは、このパケットに格納されたメディアデータ(mdat)にアクセスポイントとなるピクチャデータを含まない。
パケット格納メディアデータ(mdat)にアクセスポイントとなるデータを含まない場合、アクセスポイントを示すデータも不要となる。従って図6(b)に示すHTTPパケットにはsidxが設定されていない。
一方、アクセスポイントとなるデータを含むメディアデータ(mdat)を格納したサブGOPメディアセグメントを有するパケットには、図6(a)に示すようにsidxが設定される。
The HTTP packet illustrated in FIG. 6B is a packet that does not include sidx. The HTTP packet shown in FIG. 6B does not include picture data serving as an access point in the media data (mdat) stored in this packet.
When the packet storage media data (mdat) does not include data serving as an access point, data indicating the access point is also unnecessary. Therefore, sidx is not set in the HTTP packet shown in FIG.
On the other hand, sidx is set in a packet having a sub GOP media segment storing media data (mdat) including data serving as an access point, as shown in FIG.
図5〜図6を参照して説明したように、本実施例では、1つのGOP構成データを複数のパケットに分割して送信する。
受信装置30は、これらの複数のパケットを順次、受信し、各パケットに分割して格納されたGOP構成データを取得する。GOP単位の復号処理を行なう場合は、複数のパケットに格納されたGOP構成データを全て集めて、GOPの構成データ(NALユニット)を正しい順序に並べてGOPデータを再構成することが必要となる。
以下、GOP再構成処理に適用する情報等、受信装置側における処理をスムーズに実行させるための付加情報の設定例について説明する。
As described with reference to FIGS. 5 to 6, in this embodiment, one GOP configuration data is divided into a plurality of packets and transmitted.
The receiving
Hereinafter, a setting example of additional information for smoothly executing processing on the receiving device side, such as information applied to the GOP reconfiguration processing, will be described.
[4.HTTPヘッダに付加情報を記録した実施例について]
まず、GOP再構成処理に適用する情報等、受信装置側における処理をスムーズに実行させるための付加情報をHTTPパケットのHTTPヘッダに記録した実施例について説明する。
[4. Example in which additional information is recorded in HTTP header]
First, an embodiment will be described in which additional information for smoothly executing processing on the receiving device side, such as information applied to GOP reconfiguration processing, is recorded in an HTTP header of an HTTP packet.
図7、図8を参照してHTTPヘッダの記録情報について説明する。
図7には、先に図5を参照して説明したと同様、1つのGOPデータを3つのサブGOPメディアセグメントに分割格納したHTTPパケットの構成例を示している。
The recording information of the HTTP header will be described with reference to FIGS.
FIG. 7 shows a configuration example of an HTTP packet in which one GOP data is divided and stored in three sub GOP media segments, as described above with reference to FIG.
これら3つのHTTPパケットのHTTPヘッダに、図7に示すように、
(1)セグメント識別子(Content−Location)
(2)GOP内位識別情報(X−(Start/Middle/End)ofGOP)
これらの2つの識別情報を記録する。
In the HTTP header of these three HTTP packets, as shown in FIG.
(1) Segment identifier (Content-Location)
(2) GOP internal position identification information (X- (Start / Middle / End) ofGOP)
These two pieces of identification information are recorded.
(1)セグメント識別子は、そのHTTPパケットに格納されたセグメントのコンテンツ位置情報と、セグメントの種類とパケットに格納されたメディアデータ(mdat)の属するGOPの識別情報を含むデータである。なお、具体的にはGOPデータの位置情報(URL等のアクセス情報)を記録すればよい。 (1) The segment identifier is data including the content position information of the segment stored in the HTTP packet, the type of the segment, and the identification information of the GOP to which the media data (mdat) stored in the packet belongs. Specifically, the position information of GOP data (access information such as URL) may be recorded.
パケットを受信する受信装置30は、同一のセグメント識別子(Content−Location)が記録されたHTTPパケットは同じGOPに属するメディアデータ(mdat)を格納したHTTPパケットであると判定することができる。
The receiving
(2)GOP内位識別情報は、HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPのどの位置にあるかを示すデータである。
GOP内位識別情報=X−StartofGOPであるパケットは、GOPデータの先頭領域のNALユニットをメディアデータ(mdat)として格納したパケットである。
GOP内位識別情報=X−MiddleofGOPであるパケットは、GOPデータの中間領域のNALユニットをメディアデータ(mdat)として格納したパケットである。
GOP内位識別情報=X−EndofGOPであるパケットは、GOPデータの末尾領域のNALユニットをメディアデータ(mdat)として格納したパケットである。
(2) GOP in-position identification information is data indicating in which position in one GOP the media data (mdat) stored in the HTTP packet is located.
The packet with GOP internal identification information = X-StartofGOP is a packet in which the NAL unit in the head area of the GOP data is stored as media data (mdat).
A packet with GOP in-line identification information = X-MiddleofGOP is a packet in which a NAL unit in an intermediate area of GOP data is stored as media data (mdat).
The packet with GOP in-line identification information = X-EndofGOP is a packet in which the NAL unit in the end area of the GOP data is stored as media data (mdat).
なお、1つのGOPデータが、4つ以上のサブGOPメディアセグメントに分割された場合、GOP内位識別情報=X−MiddleofGOPを設定した複数のパケットが生成されることになる。これらのパケットに格納されるメディアデータ(mdat)のGOPデータ内配列は、HTTPヘッダ以外のパケットヘッダ情報によって判別できる。
例えばHTTPパケットを格納するLCTパケットのLCTヘッダに記録されるパケットシーケンス番号を参照することで判別可能である。なお、具体的な送信パケットの構成、およびLCTヘッダ構成については、後述する。
When one GOP data is divided into four or more sub GOP media segments, a plurality of packets in which GOP in-line identification information = X-MiddleofGOP is set are generated. The arrangement in the GOP data of the media data (mdat) stored in these packets can be determined by packet header information other than the HTTP header.
For example, it can be determined by referring to the packet sequence number recorded in the LCT header of the LCT packet storing the HTTP packet. A specific transmission packet configuration and an LCT header configuration will be described later.
従って、例えばHTTPパケットをLCTパケットに格納して送信する構成では、HTTPヘッダに設定するGOP内位置識別情報は、GOP位置が先頭領域のデータを格納したパケットのみを識別する設定としてもよい。すなわち、GOP内位識別情報=X−StartofGOPのみを記録し、この後に続くGOPデータは、LCTヘッダのシーケンス番号を参照して配列する構成としてもよい。 Therefore, for example, in a configuration in which an HTTP packet is stored in an LCT packet and transmitted, the intra-GOP position identification information set in the HTTP header may be set to identify only the packet storing the data in which the GOP position is the head area. That is, it is also possible to record only the GOP in-position identification information = X-StartofGOP, and the subsequent GOP data is arranged with reference to the sequence number of the LCT header.
図8に、メディアセグメントを格納したHTTPパケットのHTTPヘッダのデータ構成例を示す。
図8に示すようにHTTPヘッダには、例えば以下のHTTPヘッダ情報が記録される。
「・・・
HTTP/1.1 206 Partial Content
Date: Fri, 04 Oct 2013 11:14:20 GMT
Content−type: application/mp4
Content−Location: http://a.com/x.mp4
X−StartOfGOP
・・・」
FIG. 8 shows a data configuration example of the HTTP header of the HTTP packet storing the media segment.
As shown in FIG. 8, for example, the following HTTP header information is recorded in the HTTP header.
"...
HTTP / 1.1 206 Partial Content
Date: Fri, 04
Content-type: application / mp4
Content-Location: http: // a. com / x. mp4
X-StartOfGOP
... "
上記のHTTPヘッダ情報中、
セグメント識別子は、
「Content−Location: http://a.com/x.mp4」
である。
このセグメント識別子は、HTTPパケットに格納されたメディアデータ(mdat)の属するGOPの識別情報を含むものとなる。具体的にはそのGOPデータの位置情報(アクセス情報)である。
同一のセグメント識別子(Content−Location)が記録されたHTTPパケットは同じGOPに属するメディアデータ(mdat)を格納したHTTPパケットであると判定することができる。
In the above HTTP header information,
The segment identifier is
“Content-Location: http://a.com/x.mp4”
It is.
This segment identifier includes identification information of the GOP to which the media data (mdat) stored in the HTTP packet belongs. Specifically, it is position information (access information) of the GOP data.
It can be determined that an HTTP packet in which the same segment identifier (Content-Location) is recorded is an HTTP packet storing media data (mdat) belonging to the same GOP.
また、上記HTTPヘッダ情報中、
GOP内位識別情報は、
「X−StartOfGOP」
である。このGOP内位識別情報は、HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPのどの位置にあるかを示すデータである。
HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPの、
先頭領域の場合は、「X−StartOfGOP」、
中間領域の場合は、「X−MiddleOfGOP」、
末尾領域の場合は、「X−EndOfGOP」、
HTTPヘッダにはこれらのいずれかのデータがGOP内位識別情報として記録される。
In the HTTP header information,
The GOP internal identification information is
"X-StartOfGOP"
It is. This GOP in-position identification information is data indicating where in one GOP the media data (mdat) stored in the HTTP packet is located.
The media data (mdat) stored in the HTTP packet is one GOP,
In the case of the top area, “X-StartOfGOP”,
In the case of an intermediate area, “X-MiddleOfGOP”,
In the case of the end region, “X-EndOfGOP”,
Any one of these data is recorded in the HTTP header as GOP in-line identification information.
次に、初期化セグメントを格納するHTTPパケットのHTTPヘッダの記録情報について図9を参照して説明する。
初期化セグメントを格納するHTTPパケットのHTTPヘッダには、HTTPパケットが初期化セグメントを格納したパケットであることを示すセグメント識別情報を記録する。
Next, the recording information of the HTTP header of the HTTP packet storing the initialization segment will be described with reference to FIG.
Segment identification information indicating that the HTTP packet is a packet storing the initialization segment is recorded in the HTTP header of the HTTP packet storing the initialization segment.
図9に、初期化セグメントを格納したHTTPパケットのHTTPヘッダのデータ構成例を示す。
図9に示すようにHTTPヘッダには、例えば以下のHTTPヘッダ情報が記録される。
「・・・
HTTP/1.1 206 Partial Content
Date: Fri, 04 Oct 2013 11:14:20 GMT
Content−type: application/mp4
Content−Location:http://a.com/x−init.mp4」
X−InitializationSegment
・・・」
FIG. 9 shows a data configuration example of the HTTP header of the HTTP packet storing the initialization segment.
As shown in FIG. 9, for example, the following HTTP header information is recorded in the HTTP header.
"...
HTTP / 1.1 206 Partial Content
Date: Fri, 04
Content-type: application / mp4
Content-Location: http: // a. com / x-init. mp4 "
X-InitializationSegment
... "
上記のHTTPヘッダ情報中、
セグメント識別子は、
「Content−Location:http://a.com/x−init.mp4」
である。
このセグメント識別子は、初期化セグメントのURL等のアクセス情報を記録すればよい。
In the above HTTP header information,
The segment identifier is
“Content-Location: http://a.com/x-init.mp4”
It is.
As the segment identifier, access information such as the URL of the initialization segment may be recorded.
上記のHTTPヘッダ情報中、
セグメント識別情報は、
「X−InitializationSegment」
である。
このセグメント識別情報は、HTTPパケットに格納されたセグメントが、初期化セグメントであることを示す情報である。
初期化セグメントを格納したHTTPヘッダにはこのセグメント識別情報が記録される。
In the above HTTP header information,
Segment identification information
"X-InitializationSegment"
It is.
This segment identification information is information indicating that the segment stored in the HTTP packet is an initialization segment.
This segment identification information is recorded in the HTTP header storing the initialization segment.
[5.パケットの構成について]
次に、送信装置から受信装置に向けて送信されるパケットの構成例について説明する。
図10には以下の2つのIPパケットの構成例を示している。
(1)初期化セグメント格納IPパケット
(2)メディアセグメント格納IPパケット
[5. Packet configuration]
Next, a configuration example of a packet transmitted from the transmission device to the reception device will be described.
FIG. 10 shows a configuration example of the following two IP packets.
(1) Initialization segment storage IP packet (2) Media segment storage IP packet
(1)初期化セグメント格納IPパケットは、以下の構成を有する。
IPヘッダ
UDPヘッダ
LCTヘッダ
HTTPヘッダ
初期化セグメント構成データ[dash]
初期化セグメント構成データ[moov]
(1) The initialization segment storage IP packet has the following configuration.
IP header UDP header LCT header HTTP header Initialization segment configuration data [dash]
Initialization segment configuration data [moov]
IPヘッダ、UDPヘッダ、LCTヘッダ、HTTPヘッダは、それぞれIPプロトコル、UDPプロトコル、FLUTEプロトコル、HTTPプロトコルの各通信プロトコルに従って設定されるヘッダ情報である。 The IP header, UDP header, LCT header, and HTTP header are header information set in accordance with the communication protocols of the IP protocol, UDP protocol, FLUTE protocol, and HTTP protocol, respectively.
一方、(2)メディアセグメント格納IPパケットは、以下の構成を有する。
IPヘッダ
UDPヘッダ
LCTヘッダ
HTTPヘッダ
メディアセグメント構成データ[msdh]
メディアセグメント構成データ[sidx]
メディアセグメント構成データ[moof]
メディアセグメント構成データ[mdat]
On the other hand, (2) the media segment storage IP packet has the following configuration.
IP header UDP header LCT header HTTP header Media segment configuration data [msdh]
Media segment configuration data [sidx]
Media segment configuration data [moof]
Media segment configuration data [mdat]
IPヘッダ、UDPヘッダ、LCTヘッダ、HTTPヘッダは、それぞれIPプロトコル、UDPプロトコル、FLUTEプロトコル、HTTPプロトコルの各通信プロトコルに従って設定されるヘッダ情報である。
なお、前述したようにメディアセグメント構成データ[sidx]は、ランダムアクセスに適用可能なメディアデータ(mdat)を有するパケットには設定されるが、それ以外のパケットには設定不要である。
The IP header, UDP header, LCT header, and HTTP header are header information set in accordance with the communication protocols of the IP protocol, UDP protocol, FLUTE protocol, and HTTP protocol, respectively.
As described above, the media segment configuration data [sidx] is set for a packet having media data (mdat) applicable to random access, but need not be set for other packets.
送信装置20は、図10に示すIPパケットを生成して受信装置30に向けて送信する。
受信装置30は、受信装置20から受信する図10に示す各パケットを受信し、各ヘッダ情報を解析して、セグメントを取り出し、セグメント格納データに従って、初期設定やコンテンツ再生を実行する。
The
The receiving
[6.送信装置と受信装置の構成と処理について]
次に、図11以下を参照して送信装置と受信装置の構成と処理について説明する。
まず、図11を参照して、送信装置20と受信装置30の構成とプロトコルスタックについて説明する。
[6. Configuration and processing of transmission device and reception device]
Next, the configuration and processing of the transmission device and the reception device will be described with reference to FIG.
First, the configuration and protocol stack of the
図10を参照して説明したIPパケットを生成して送信する送信装置20は、図11に示すようにデータ処理部21と通信部22を有する。
データ処理部21は、送信パケットの生成処理を実行する。
具体的には、例えば前述したように符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータ(mdat)と、メディアデータ対応のメタデータ(moof)を格納したサブGOPメディアセグメントをパケット格納データとして生成する。さらに、サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子等のパケット付加情報を生成してHTTPヘッダに記録したパケットを生成する。
The
The
Specifically, for example, as described above, media data (mdat) including only a part of configuration data of GOP (Group of Pictures), which is a processing unit of encoded data, and metadata (moof) corresponding to media data are included. The stored sub GOP media segment is generated as packet storage data. Further, packet additional information such as an in-GOP position identifier indicating the position in the GOP of the media data which is the storage data of the sub GOP media segment is generated, and a packet recorded in the HTTP header is generated.
通信部22は、データ処理部21の生成したパケットを送信する。
通信部22は、データ処理部21の生成したパケットを、放送波、あるいはインターネット等のネットワークを介してブロードキャスト配信、またはマルチキャスト配信する。
The
The
データ処理部21と通信部22は、以下のレイヤからなるプロトコルスタックに従ってパケット生成処理を実行し、生成したパケットを送信する。以下、送信装置20のプロトコルスタックのレイヤ構成について説明する。送信装置20のプロトコルスタックは、上位レイヤから下位レイヤまで、以下に示すレイヤ構成を有する。
(1)DASH Server:DASH規格に従ったセグメント生成等の処理を実行するアプリケーションレイヤ
(2)Video/Audio/Subtitle etc:送信対象コンテンツの生成、取得を実行するアプリケーションレイヤ
(3)FragmentedMP4:MP4ファイルフォーマットに従った符号化データを生成しセグメントを生成するアプリケーションレイヤ
(4)HTTP:HTTPプロトコルに従ってHTTPヘッダを有するHTTPパケットを生成するレイヤ
(5)FLUTE/ALC(LCT):FLUTEプロトコルに従ってLCTヘッダを有するFLUTEパケットを生成するレイヤ
(6)UDP:UDPプロトコルに従ってUDPヘッダを有するUDPパケットを生成するレイヤ
(7)IP:IPプロトコルに従ってIPヘッダを有するIPパケットを生成するレイヤ
(8)PHY:IPパケット、またはIPパケットを格納したMACフレームを生成して送信する通信部等から構成される物理レイヤ
The
(1) DASH Server: Application layer that executes processing such as segment generation according to the DASH standard (2) Video / Audio / Subtitle etc: Application layer that generates and acquires content to be transmitted (3) Fragmented MP4: MP4 file Application layer that generates encoded data according to the format and generates a segment (4) HTTP: Layer that generates an HTTP packet having an HTTP header according to the HTTP protocol (5) FLUTE / ALC (LCT): An LCT header according to the FLUTE protocol (6) UDP: Layer that generates a UDP packet having a UDP header according to the UDP protocol (7) IP Layer that generates an IP packet having an IP header in accordance with the IP protocol (8) PHY: IP packets or physical layer a communication unit or the like for generating and transmitting the MAC frame storing an IP packet,
また、図10を参照して説明したIPパケットを受信する受信装置30は、図11に示すようにデータ処理部31と通信部32を有する。
通信部32は、送信装置20の送信するパケットを受信し、データ処理部31は通信部31の受信したパケットを入力して、データ処理を行なう。
In addition, the receiving
The
データ処理部31と通信部32は、以下のレイヤからなるプロトコルスタックに従ってパケットの受信、解析を実行する。受信装置30のプロトコルスタックは、上位レイヤから下位レイヤまで、以下に示すレイヤ構成を有する。
(1)DASH Client:DASH規格に従ったセグメントの解析等の処理を実行するアプリケーションレイヤ
(2)Video/Audio/Subtitle etc:受信コンテンツの取得、再生処理等を実行するアプリケーションレイヤ
(3)FragmentedMP4:MP4ファイルフォーマットに従った符号化データの復号処理等を実行するアプリケーションレイヤ
(4)HTTP:HTTPプロトコルに従ってHTTPヘッダを有するHTTPパケットを解析するレイヤ
(5)FLUTE/ALC(LCT):FLUTEプロトコルに従ってLCTヘッダを有するFLUTEパケットを解析するレイヤ
(6)UDP:UDPプロトコルに従ってUDPヘッダを有するUDPパケットを解析するレイヤ
(7)IP:IPプロトコルに従ってIPヘッダを有するIPパケットを解析するレイヤ
(8)PHY:IPパケット、またはIPパケットを格納したMACフレームを受信する通信部等から構成される物理レイヤ
The
(1) DASH Client: Application layer that executes processing such as segment analysis according to the DASH standard (2) Video / Audio / Subtitle etc: Application layer that executes reception content acquisition, playback processing, etc. (3) Fragmented MP4: (4) HTTP: Layer for analyzing HTTP packet having HTTP header according to HTTP protocol (5) FLUTE / ALC (LCT): LCT according to FLUTE protocol Layer for analyzing FLUTE packet having header (6) UDP: Layer for analyzing UDP packet having UDP header according to UDP protocol (7) IP: Layer (8) PHY for analyzing the IP packet having the IP header according to the P protocol: IP packets or physical layer a communication unit or the like for receiving a MAC frame storing an IP packet,
なお、送信装置20は、前述したようにIPパケットをブロードキャスト、あるいはマルチキャスト送信する際、ネットワークを介した送信、あるいは放送波を介した送信のいずれか、または、これらの双方の通信経路を利用して並列送信する処理を行なう。
Note that, as described above, when the IP device broadcasts or multicasts an IP packet, the
受信装置30は、放送波と、インターネット等のネットワークのいずれかの通信経路、または両通信経路を介したパケット受信処理を行なう。
インターネット等のネットワークを介した送受信パケットの生成および解析は、図11に示すFLUTE/ALC(LCT)レイヤとUDPレイヤを、TCPレイヤに置き換えて行なうことが可能である。
The receiving
Generation and analysis of transmission / reception packets via a network such as the Internet can be performed by replacing the FLUTE / ALC (LCT) layer and the UDP layer shown in FIG. 11 with TCP layers.
放送波を介して受信するIPパケットと、インターネット等のネットワークを介して受信するIPパケットを適宜、切り替えて処理を行なう受信装置30のプロトコルスタックの例について、図12を参照して説明する。
An example of a protocol stack of the receiving
図12に示す受信装置30のプロトコルスタックは、以下の2つの通信系に対応したプロトコルスタックのレイヤ構成を示している。
(1)放送系
(2)ネットワーク通信系
The protocol stack of the receiving
(1) Broadcast system (2) Network communication system
(1)放送系は、図11を参照して説明したレイヤ構成となっている。
(2)ネットワーク通信系は、放送系レイヤのFLUTE/ALC(LCT)レイヤと、UDPレイヤをTCPレイヤに置き換えた構成である。
TCPレイヤは、TCPヘッダを有するTCPパケットの解析を実行する。
シグナリング(Signaling)レイヤは、各通信系の切り替え制御を行うためのレイヤである。
(1) The broadcasting system has the layer configuration described with reference to FIG.
(2) The network communication system has a configuration in which the FLUTE / ALC (LCT) layer of the broadcast system layer and the UDP layer are replaced with a TCP layer.
The TCP layer performs analysis of a TCP packet having a TCP header.
The signaling layer is a layer for performing switching control of each communication system.
受信装置30は、放送系とネットワーク通信系の各レイヤを、適宜切り替えて利用することで、放送波を介して受信するパケットと、インターネット等のネットワークを介して受信するパケットを選択的に利用してパケット格納コンテンツを取得して再生処理を実行することができる。
The receiving
例えば、ネットワークからのパケット受信に遅延が発生した場合、放送系に切り替えて同一コンテンツに対応するパケットを、放送波を介して受信し、コンテンツ再生を継続することができる。
ネットワーク通信系、放送系のいずれの通信系を介した配信パケットにも、前述したセグメント識別子やGOP内位置識別子が記録されており、これらの識別情報を参照して、GOPデータの再構築が可能となり、エラーのない復号処理と、コンテンツ再生が実現される。
For example, when a delay occurs in packet reception from the network, it is possible to switch to the broadcast system, receive a packet corresponding to the same content via a broadcast wave, and continue content reproduction.
The segment identifier and the intra-GOP location identifier described above are recorded in the delivery packet via both the network communication system and the broadcast system, and the GOP data can be reconstructed by referring to these identification information. Thus, error-free decoding processing and content reproduction are realized.
[7.パケットに格納したNALユニットがSAP(ストリームアクセスポイント)を含むか否かを識別可能としたアクセスポイント情報を付加した構成について]
次に、受信装置の処理効率化を実現する構成例として、パケットに格納したNALユニットフラグメントの分割元であるNALユニットにSAP(アクセスポイントデータ)を含むか否かを識別可能とした識別情報を付加した構成について説明する。
[7. Concerning a configuration in which access point information that can identify whether or not a NAL unit stored in a packet includes an SAP (stream access point) is added]
Next, as a configuration example for realizing the processing efficiency improvement of the receiving apparatus, identification information that makes it possible to identify whether the NAL unit that is the division source of the NAL unit fragment stored in the packet includes SAP (access point data) or not is provided. The added configuration will be described.
先に、図3他を参照して説明したようにSAP(Stream Access Point)は、ランダムアクセスポイントとなるデータの格納位置情報である。DASHではランダムアクセスポイントをSAP(Stream Access Point)と呼ぶ。SAPは、例えばストリームを復号するために必要なすべての状態をリセットすることができる画像シーケンスの先頭ピクチャの先頭バイト位置を示す。具体的には、例えばMPEGデータのIピクチャ位置等を示す情報である。
なお、先に図3(b)を参照して説明したように、SAPはメディアセグメントのメタ情報である[sidx]に格納されている。
As described above with reference to FIG. 3 and others, SAP (Stream Access Point) is storage location information of data serving as a random access point. In DASH, a random access point is called SAP (Stream Access Point). The SAP indicates the start byte position of the start picture of the image sequence that can reset all the states necessary for decoding the stream, for example. Specifically, it is information indicating the I picture position of MPEG data, for example.
As described above with reference to FIG. 3B, the SAP is stored in [sidx] that is meta information of the media segment.
受信装置側では、SAPの示すデータ位置の符号化データを取得して、その取得データから復号処理を実行して再生を行なうことが可能となる。
従って、コンテンツの途中から再生するなどの特殊再生処理を行う場合、SAPは重要な必須データとなる。例えば、GOPデータの全てを揃えることなく、SAPにによって指定される符号化データを取得し復号することでランダムアクセスポイントの画像を再生可能となる。
On the receiving device side, it is possible to acquire encoded data at the data position indicated by SAP, perform decoding processing from the acquired data, and perform reproduction.
Therefore, when special reproduction processing such as reproduction from the middle of content is performed, SAP becomes important indispensable data. For example, an image of a random access point can be reproduced by acquiring and decoding encoded data specified by SAP without arranging all of the GOP data.
また、受信装置は、例えば配信遅延などによってGOP単位の全符号化データのパケット受信が間に合わない場合などに、SAPによって指定されるランダムアクセスポイントデータを優先して処理を行なうことも可能である。ランダムアクセスポイントデータを選択して復号、再生することで、表示部の画像表示を継続可能となる。このように、処理優先度を判定する場合にもSAPは重要なデータとなる。 In addition, the receiving apparatus can also preferentially process random access point data specified by the SAP, for example, when reception of all encoded data packets in units of GOP is not in time due to distribution delay or the like. By selecting random access point data and decoding and reproducing it, the image display on the display unit can be continued. As described above, the SAP is important data when determining the processing priority.
1つのGOP単位データの中には、確実にランダムアクセスポイントが存在する。しかし、図5〜図10を参照して説明したように、1つのパケットの格納データを1GOP単位のデータではなく、1GOPを細分化して、1つまたは複数のNALユニットを格納したパケットは、パケットに格納したNALユニットにランダムアクセスポイントが含まれる場合と含まれない場合がある。 A random access point is surely present in one GOP unit data. However, as described with reference to FIGS. 5 to 10, the storage data of one packet is not data of 1 GOP unit, but a packet in which 1 GOP is subdivided and one or a plurality of NAL units are stored is a packet. The NAL unit stored in may or may not include a random access point.
図5〜図10を参照して説明した構成では、例えば図7に示すように、サブGOPメディアセグメントHTTPパケットにメタデータである「sidx」を含むパケットと含まないパケットを設定している。
サブGOPメディアセグメントHTTPパケットに格納されたNALユニットにランダムアクセスポイント対応のデータが含まれればSAPを記録した[sidx]が設定される。
しかし、[sidx]は、メディアデータのランダムアクセスポイント情報であるSAPのみならず、その他のデータの境界情報等も含むメタデータであり、[sidx]の有無のみによってパケット格納データにアクセスポイントとなるデータが含まれるか否かを判定することはできない。
In the configuration described with reference to FIGS. 5 to 10, for example, as illustrated in FIG. 7, a packet including metadata “sidx” and a packet not including the metadata are set in the sub GOP media segment HTTP packet.
If the NAL unit stored in the sub GOP media segment HTTP packet includes data corresponding to a random access point, [sidx] in which SAP is recorded is set.
However, [sidx] is metadata including not only SAP, which is random access point information of media data, but also boundary information of other data, etc., and it becomes an access point to packet storage data only by the presence / absence of [sidx]. It cannot be determined whether or not data is included.
従って、上述したサブGOPメディアセグメントHTTPパケットを利用した符号化データ配信構成では、受信装置側は、受信パケット単位でパケットにアクセスポイントデータが含まれるか否かを判定することが困難になる。
以下、このような問題を解決し、受信装置側で、受信パケット単位で、パケットにアクセスポイントデータが含まれるか否かを判定可能とした構成について説明する。
Therefore, in the encoded data distribution configuration using the above-described sub GOP media segment HTTP packet, it is difficult for the receiving apparatus side to determine whether or not the access point data is included in the packet in units of received packets.
Hereinafter, a configuration will be described in which such a problem is solved, and the reception apparatus can determine whether or not the access point data is included in the packet for each received packet.
図13以下を参照して、上述したサブGOPメディアセグメントHTTPパケットを利用した符号化データ配信構成において、パケット単位で各パケットにアクセスポイントデータが含まれるか否かを判定可能とした構成について説明する。
図13は、先に説明した図5、図7と同様、1つのGOPデータを3つのサブGOPメディアセグメントに分割格納したHTTPパケットの構成例を示している。
With reference to FIG. 13 and subsequent figures, a description will be given of a configuration in which it is possible to determine whether or not access point data is included in each packet in a packet unit in the above-described encoded data distribution configuration using the sub GOP media segment HTTP packet. .
FIG. 13 shows an example of the configuration of an HTTP packet in which one GOP data is divided and stored in three sub GOP media segments, similar to FIGS. 5 and 7 described above.
これら3つのHTTPパケットのHTTPヘッダには、先に図7を参照して説明した以下の付加情報が記録される。
(1)セグメント識別子(Content−Location)
(2)GOP内位識別情報(X−(Start/Middle/End)ofGOP)
さらに、図13に示す例では、HTTPヘッダに以下の付加情報を追加記録する。
(3)アクセスポイント情報(X−SAP)
これらの3つの情報を記録する。
The following additional information described above with reference to FIG. 7 is recorded in the HTTP headers of these three HTTP packets.
(1) Segment identifier (Content-Location)
(2) GOP internal position identification information (X- (Start / Middle / End) ofGOP)
Furthermore, in the example shown in FIG. 13, the following additional information is additionally recorded in the HTTP header.
(3) Access point information (X-SAP)
These three pieces of information are recorded.
(1)セグメント識別子は、そのHTTPパケットに格納されたセグメントのコンテンツ位置情報と、セグメントの種類とパケットに格納されたメディアデータ(mdat)の属するGOPの識別情報を含むデータである。なお、具体的にはGOPデータの位置情報(URL等のアクセス情報)を記録すればよい。 (1) The segment identifier is data including the content position information of the segment stored in the HTTP packet, the type of the segment, and the identification information of the GOP to which the media data (mdat) stored in the packet belongs. Specifically, the position information of GOP data (access information such as URL) may be recorded.
パケットを受信する受信装置30は、同一のセグメント識別子(Content−Location)が記録されたHTTPパケットは同じGOPに属するメディアデータ(mdat)を格納したHTTPパケットであると判定することができる。
The receiving
(2)GOP内位識別情報は、HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPのどの位置にあるかを示すデータである。
GOP内位識別情報=X−StartofGOPであるパケットは、GOPデータの先頭領域のNALユニットをメディアデータ(mdat)として格納したパケットである。
GOP内位識別情報=X−MiddleofGOPであるパケットは、GOPデータの中間領域のNALユニットをメディアデータ(mdat)として格納したパケットである。
GOP内位識別情報=X−EndofGOPであるパケットは、GOPデータの末尾領域のNALユニットをメディアデータ(mdat)として格納したパケットである。
(2) GOP in-position identification information is data indicating in which position in one GOP the media data (mdat) stored in the HTTP packet is located.
The packet with GOP internal identification information = X-StartofGOP is a packet in which the NAL unit in the head area of the GOP data is stored as media data (mdat).
A packet with GOP in-line identification information = X-MiddleofGOP is a packet in which a NAL unit in an intermediate area of GOP data is stored as media data (mdat).
The packet with GOP in-line identification information = X-EndofGOP is a packet in which the NAL unit in the end area of the GOP data is stored as media data (mdat).
なお、1つのGOPデータが、4つ以上のサブGOPメディアセグメントに分割された場合、GOP内位識別情報=X−MiddleofGOPを設定した複数のパケットが生成されることになる。これらのパケットに格納されるメディアデータ(mdat)のGOPデータ内配列は、HTTPヘッダ以外のパケットヘッダ情報によって判別できる。
例えばHTTPパケットを格納するLCTパケットのLCTヘッダに記録されるパケットシーケンス番号を参照することで判別可能である。なお、具体的な送信パケットの構成、およびLCTヘッダ構成については、後述する。
When one GOP data is divided into four or more sub GOP media segments, a plurality of packets in which GOP in-line identification information = X-MiddleofGOP is set are generated. The arrangement in the GOP data of the media data (mdat) stored in these packets can be determined by packet header information other than the HTTP header.
For example, it can be determined by referring to the packet sequence number recorded in the LCT header of the LCT packet storing the HTTP packet. A specific transmission packet configuration and an LCT header configuration will be described later.
従って、例えばHTTPパケットをLCTパケットに格納して送信する構成では、HTTPヘッダに設定するGOP内位置識別情報は、GOP位置が先頭領域のデータを格納したパケットのみを識別する設定としてもよい。すなわち、GOP内位識別情報=X−StartofGOPのみを記録し、この後に続くGOPデータは、LCTヘッダのシーケンス番号を参照して配列する構成としてもよい。 Therefore, for example, in a configuration in which an HTTP packet is stored in an LCT packet and transmitted, the intra-GOP position identification information set in the HTTP header may be set to identify only the packet storing the data in which the GOP position is the head area. That is, it is also possible to record only the GOP in-position identification information = X-StartofGOP, and the subsequent GOP data is arranged with reference to the sequence number of the LCT header.
(3)アクセスポイント情報(X−SAP)は、HTTPパケットに格納されたメディアデータ(mdat)に含まれる符号化データにランダムアクセスポイントとなるデータが含まれるか否かを示す情報である。
受信装置は、このアクセスポイント情報(X−SAP)を参照することで、そのHTTPパケットに格納されたメディアデータ内のNALユニットがアクセスポイントデータを含むか否かを即座に判別することができる。
従って、例えばアクセスポイントデータのみを優先して復号、再生を行なう場合には、HTTPヘッダに記録されたアクセスポイント情報(X−SAP)を参照して、処理対象パケットを選択することができる。すなわち、HTTPヘッダに記録されたアクセスポイント情報(X−SAP)が、パケット格納データ(NALユニット)にアクセスポイントが含まれることを示すパケットのみを選択して処理を行なうことが可能となる。
(3) The access point information (X-SAP) is information indicating whether or not encoded data included in the media data (mdat) stored in the HTTP packet includes data serving as a random access point.
By referring to the access point information (X-SAP), the receiving apparatus can immediately determine whether or not the NAL unit in the media data stored in the HTTP packet includes access point data.
Therefore, for example, when decoding and reproduction are performed with priority given only to access point data, the processing target packet can be selected with reference to the access point information (X-SAP) recorded in the HTTP header. That is, the access point information (X-SAP) recorded in the HTTP header can be processed by selecting only a packet indicating that the access point is included in the packet storage data (NAL unit).
なお、図13に示す例では、図13(b1)〜(b3)のすべてのHTTPパケットにアクセスポイント情報(X−SAP)を設定し、アクセスポイント情報(X−SAP)が、各HTTPパケットに格納されたメディアデータ(mdat)に含まれる符号化データにランダムアクセスポイントとなるデータが含まれるか否かを示す構成としている。
このような構成の他、例えば、HTTPパケットに格納されたメディアデータ(mdat)に含まれる符号化データにランダムアクセスポイントとなるデータが含まれる場合にのみ、そのHTTPパケットのHTTPヘッダにアクセスポイント情報(X−SAP)を記録する構成としてもよい。すなわち、HTTPパケットに格納されたメディアデータ(mdat)に含まれる符号化データにランダムアクセスポイントとなるデータが含まれない場合は、HTTPヘッダにアクセスポイント情報(X−SAP)を記録しない。例えば、図13(b2),(b3)に示すHTTPパケットにランダムアクセスポイントとなるデータが含まれない場合は、HTTPヘッダにアクセスポイント情報(X−SAP)を記録しない。
この設定の場合、受信装置は、HTTPヘッダにアクセスポイント情報(X−SAP)が記録されているか否かに応じて、HTTPパケットに格納されたメディアデータ(mdat)に含まれる符号化データにランダムアクセスポイントとなるデータが含まれるか否かを判定する。
In the example shown in FIG. 13, the access point information (X-SAP) is set in all HTTP packets in FIGS. 13 (b1) to (b3), and the access point information (X-SAP) is set in each HTTP packet. The encoded data included in the stored media data (mdat) is configured to indicate whether data serving as a random access point is included.
In addition to such a configuration, for example, only when encoded data included in media data (mdat) stored in an HTTP packet includes data serving as a random access point, access point information is included in the HTTP header of the HTTP packet. (X-SAP) may be recorded. That is, when the encoded data included in the media data (mdat) stored in the HTTP packet does not include data serving as a random access point, the access point information (X-SAP) is not recorded in the HTTP header. For example, when data serving as a random access point is not included in the HTTP packet shown in FIGS. 13B2 and 13B3, the access point information (X-SAP) is not recorded in the HTTP header.
In the case of this setting, the receiving apparatus randomly selects the encoded data included in the media data (mdat) stored in the HTTP packet according to whether or not the access point information (X-SAP) is recorded in the HTTP header. It is determined whether data serving as an access point is included.
このアクセスポイント情報(X−SAP)は、ランダムアクセス可能なデータの有無をパケット単位で識別可能とする情報である。受信装置側では、各パケットのアクセスポイント情報(X−SAP)を参照して、ランダムアクセス可能なデータの格納されたパケットを選別することが可能となる。受信装置は、例えばランダムアクセス可能なデータの格納されたパケットをを優先処理することで、ランダムアクセスポイントからのデータ再生処理等を迅速に行うことが可能となる。 This access point information (X-SAP) is information that makes it possible to identify the presence / absence of randomly accessible data in units of packets. On the receiving device side, it is possible to select packets storing randomly accessible data with reference to the access point information (X-SAP) of each packet. For example, the receiving apparatus can perform a data reproduction process from a random access point quickly by preferentially processing a packet storing randomly accessible data.
図14に、メディアセグメントを格納したHTTPパケットのHTTPヘッダのデータ構成例を示す。
図14に示すようにHTTPヘッダには、例えば以下のHTTPヘッダ情報が記録される。
「・・・
HTTP/1.1 206 Partial Content
Date: Fri, 04 Oct 2013 11:14:20 GMT
Content−type: application/mp4
Content−Location: http://a.com/x.mp4
X−StartOfGOP
X−SAP
・・・」
FIG. 14 shows a data configuration example of an HTTP header of an HTTP packet storing a media segment.
As shown in FIG. 14, for example, the following HTTP header information is recorded in the HTTP header.
"...
HTTP / 1.1 206 Partial Content
Date: Fri, 04
Content-type: application / mp4
Content-Location: http: // a. com / x. mp4
X-StartOfGOP
X-SAP
... "
上記のHTTPヘッダ情報中、
セグメント識別子「Content−Location: http://a.com/x.mp4」
GOP内位識別情報「X−StartOfGOP」、
これらについては、先に図8を参照して説明したと同様の情報である。
すなわち、セグメント識別子は、HTTPパケットに格納されたメディアデータ(mdat)の属するGOPの識別情報として機能するGOPデータの位置情報(アクセス情報)である。
GOP内位識別情報は、HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPのどの位置にあるかを示すデータである。
先頭領域の場合は、「X−StartOfGOP」、
中間領域の場合は、「X−MiddleOfGOP」、
末尾領域の場合は、「X−EndOfGOP」、
HTTPヘッダにはこれらのいずれかのデータがGOP内位識別情報として記録される。
In the above HTTP header information,
Segment identifier “Content-Location: http://a.com/x.mp4”
GOP internal identification information “X-StartOfGOP”,
These are the same information as described above with reference to FIG.
That is, the segment identifier is position information (access information) of GOP data that functions as identification information of the GOP to which the media data (mdat) stored in the HTTP packet belongs.
The GOP in-position identification information is data indicating where in one GOP the media data (mdat) stored in the HTTP packet is located.
In the case of the top area, “X-StartOfGOP”,
In the case of an intermediate area, “X-MiddleOfGOP”,
In the case of the end region, “X-EndOfGOP”,
Any one of these data is recorded in the HTTP header as GOP in-line identification information.
また、図14に示すHTTPヘッダ情報中、
アクセスポイント情報「X−SAP」は、そのHTTPパケットに格納されたメディアデータ(mdat)に含まれる符号化データ(NAL)にランダムアクセスポイントとなるデータが含まれるか否かを示す情報である。
In the HTTP header information shown in FIG.
The access point information “X-SAP” is information indicating whether or not the encoded data (NAL) included in the media data (mdat) stored in the HTTP packet includes data serving as a random access point.
受信装置は、アクセスポイント情報(X−SAP)を参照することで、受信パケット単位でパケット格納メディアデータ内のNALユニットにアクセスポイントが含まれるか否かを即座に判別することができる。 By referring to the access point information (X-SAP), the receiving apparatus can immediately determine whether or not the access point is included in the NAL unit in the packet storage media data for each received packet.
受信装置は、アクセスポイントが含まれるパケットのみを選択して、これらのパケットの格納データを優先して復号し、再生することが可能となる。例えば配信遅延などによってGOP単位の全符号化データのパケット受信が間に合わない場合などに、ランダムアクセスポイントデータを優先して復号、再生することで、表示部の画像表示を継続させるといった処理が可能となる。 The receiving apparatus can select only the packets including the access points, decode the data stored in these packets with priority, and reproduce them. For example, when packet reception of all encoded data in units of GOP is not in time due to distribution delay, etc., it is possible to perform processing such as continuing image display on the display unit by preferentially decoding and reproducing random access point data. Become.
[8.NALユニットをさらに分割したNALユニットフラグメント格納パケットを利用した通信処理構成について]
上述したように、GOPの分割データである1つのNALユニット、または複数のNALユニットを含むパケットを利用したデータ送受信を行うことで、ネットワーク上の1つの転送パケットのデータ量の削減が実現される。
[8. Communication processing configuration using NAL unit fragment storage packet obtained by further dividing NAL unit]
As described above, the data amount of one transfer packet on the network can be reduced by performing data transmission / reception using one NAL unit which is GOP divided data or a packet including a plurality of NAL units. .
しかし、例えば高画質の画像データである4Kコンテンツや8Kコンテンツなど、データ量が多い画像データについては、これらの大容量画像データの符号化処理によって生成するNALユニットのデータ量が増大する。すなわち、1つのNALユニットそのもののデータ量が非常に大きくなる場合が想定される。 However, for image data with a large amount of data, such as 4K content or 8K content, which is high-quality image data, for example, the data amount of the NAL unit generated by the encoding process of these large-capacity image data increases. That is, it is assumed that the data amount of one NAL unit itself becomes very large.
IPレイヤにおけるデータ転送処理において、例えばイーサネット(登録商標)を介したデータ転送を行う場合、IPパケットをイーサネット(登録商標)で規定される最大データ転送単位(MTU:Maximum Transfer Unit)以下のMACフレームを生成して転送することが必要となる。
すなわち最大データ転送単位(MTU)の規定されたネットワークを介してパケットを転送する場合には、MTU以上のデータ量を持つIPパケットについて、MTUで規定するデータ量以下に分割するフラグメント処理を実行し、各分割データを格納した複数のMACフレームを生成して転送する処理が必須となる。
In data transfer processing in the IP layer, for example, when performing data transfer via Ethernet (registered trademark), an IP packet is a MAC frame equal to or less than the maximum data transfer unit (MTU: Maximum Transfer Unit) defined by Ethernet (registered trademark). Must be generated and transferred.
That is, when a packet is transferred through a network in which the maximum data transfer unit (MTU) is specified, an IP packet having a data amount greater than or equal to the MTU is subjected to fragment processing for dividing it into a data amount that is specified by the MTU or less. A process of generating and transferring a plurality of MAC frames storing each divided data is essential.
例えばイーサネット(登録商標)の規定するMACフレームのフレーム単位の最大データ転送量(MTU)は約1500バイトである。
MACフレームは、例えば図15に示す構成を有し、先に図10を参照して説明したIPパケットの先頭にMACヘッダを設定した構成である。例えば図15に示すMACフレームでは、MACフレームのペイロードとなるIPヘッダ〜mdatまでのデータ量をMTU=1500バイト以下に設定することが必要となる。
For example, the maximum data transfer amount (MTU) of each MAC frame defined by Ethernet (registered trademark) is about 1500 bytes.
The MAC frame has a configuration shown in FIG. 15, for example, and has a configuration in which a MAC header is set at the head of the IP packet described above with reference to FIG. For example, in the MAC frame shown in FIG. 15, it is necessary to set the data amount from the IP header to mdat, which is the payload of the MAC frame, to MTU = 1500 bytes or less.
送信装置20から受信装置30にパケット送信を行う場合、送信装置20や受信装置30側の各デバイス間通信や、送信装置20と受信装置30間の中継装置等において、このMTUに応じたフラグメンテーション、すなわちパケット分割処理と、分割データの再構成処理が繰り返し実行される可能性がある。
このような事態が発生すると、送信装置20におけるコンテンツ入力から受信装置30におけるコンテンツ再生までの時間に遅延が発生し、受信装置30におけるコンテンツの再生遅延が発生する可能性が高まることになる。
When packet transmission is performed from the
When such a situation occurs, a delay occurs in the time from content input in the
以下では、このような事態を防止する構成について説明する。
以下に説明する実施例において、送信装置20は、パケット生成処理段階におけるHTTPレイヤにおいて、パケットのデータサイズを所定サイズ以下に設定する。具体的には、通信路において想定される最大データ転送単位(MTU:Maximum Transfer Unit)以下の小さなデータサイズとする。具体的には、例えば1つのNALユニットをさらに分割したNALユニットフラグメントを格納したパケットを生成して送信する。
Below, the structure which prevents such a situation is demonstrated.
In the embodiment described below, the
前述したように、例えばイーサネット(登録商標)の規定するMACフレームのフレーム単位の一般的な最大データ転送量(MTU)は約1500バイトである。
送信装置20のデータ処理部はHTTPパケットの生成段階で、このMTUを考慮したパケット生成を行う。例えば、HTTPパケットを格納したMACフレームのフレームサイズが1500バイト以下になるようにパケット生成を実行する。
As described above, for example, a general maximum data transfer amount (MTU) of a frame unit of a MAC frame defined by Ethernet (registered trademark) is about 1500 bytes.
The data processing unit of the
送信装置20のデータ処理部において、通信経路における最大データ転送量(MTU)を考慮したパケット生成処理を実行することで、送信装置や、中継装置、あるいは受信装置のIPレイヤにおいてMTUに従ったパケット分割処理であるフラグメンテーションが不要となり、データ転送をスムーズに実行することが可能になる。
The packet processing according to the MTU is performed in the IP layer of the transmission device, the relay device, or the reception device by executing packet generation processing in consideration of the maximum data transfer amount (MTU) in the communication path in the data processing unit of the
このように、送信装置20のデータ処理部はHTTPパケットの生成段階で、パケット格納データを通信経路において規定されるMTU以下の小さなフラグメントに設定する処理を実行する。この処理により、例えば、通信路のIPレイヤにおけるフラグメンテーション処理よるオーバーヘッドが低減される。
As described above, the data processing unit of the
先に図5他を参照して説明した例では、1つまたは複数のNALユニットをメディアデータ(mdat)とし、さらにその属性データであるメタデータ(moof)と組み合わせて1つのフラグメントを生成し、このフラグメントを持つサブGOPメディアセグメントを格納したHTTPパケットを生成していた。 In the example described above with reference to FIG. 5 and others, one or a plurality of NAL units are set as media data (mdat), and further combined with metadata (moof) that is attribute data thereof, one fragment is generated, An HTTP packet storing a sub GOP media segment having this fragment was generated.
以下に説明する実施例では、1つのNALユニットを分割したNALユニットフラグメント(NALf)をメディアデータ(mdat)として格納したHTTPパケットを生成する。
なお、NALユニット対応の属性データである(moof)は、メディアデータ(mdat)格納パケットと異なる別の独立したHTTPパケットに格納して配信する。
In the embodiment described below, an HTTP packet in which a NAL unit fragment (NALf) obtained by dividing one NAL unit is stored as media data (mdat) is generated.
The attribute data (moof) corresponding to the NAL unit is stored and distributed in another independent HTTP packet different from the media data (mdat) storage packet.
図16を参照して、本実施例におけるHTTPパケットの構成例について説明する。
図16(a)は、先に図5〜図7等を参照して説明したサブGOPメディアセグメントである。すなわちGOPを分割したデータである1つ以上のNALユニットをメディアデータ(mdat)として格納したセグメントである。
ただし、図16(a)に示すサブGOPメディアセグメントはメディアデータ(mdat)として1つのNALユニットのみを格納した例である。NALユニットは1に限らず複数のNALユニットとしてもよい。
With reference to FIG. 16, the structural example of the HTTP packet in a present Example is demonstrated.
FIG. 16A shows the sub GOP media segment described above with reference to FIGS. That is, it is a segment in which one or more NAL units, which are data obtained by dividing GOP, are stored as media data (mdat).
However, the sub GOP media segment shown in FIG. 16A is an example in which only one NAL unit is stored as media data (mdat). The number of NAL units is not limited to 1 and may be a plurality of NAL units.
本実施例では、この図16(a)に示すようなサブGOPメディアセグメントをさらに分割して複数のHTTPパケットを生成する。分割処理は、通信経路における最大データ転送量(MTU)を考慮して実行する。例えば、分割後のHTTPパケットを格納したMACフレームを生成した場合に、MACフレームに許容される最大データ転送単位(MTU:Maximum Transfer Unit)以下となるように行う。 In the present embodiment, the sub GOP media segment as shown in FIG. 16A is further divided to generate a plurality of HTTP packets. The division process is executed in consideration of the maximum data transfer amount (MTU) in the communication path. For example, when a MAC frame storing a divided HTTP packet is generated, the MAC frame is set to be equal to or less than a maximum data transfer unit (MTU: Maximum Transfer Unit) allowed for the MAC frame.
なお、分割処理に際しては1つまたは複数のNALユニットを分割するNALユニット分割処理を行なうことになる。以下では、NALユニットの分割後のデータをNALユニットフラグメント(NALf)として説明する。
また、サブGOPメディアセグメントの構成データを分割して生成したHTTPパケットをNALユニットフラグメント対応HTTPパケットと呼ぶ。
In the division process, a NAL unit division process for dividing one or a plurality of NAL units is performed. Hereinafter, the data after the division of the NAL unit will be described as a NAL unit fragment (NALf).
In addition, an HTTP packet generated by dividing the configuration data of the sub GOP media segment is referred to as a NAL unit fragment compatible HTTP packet.
図16に示す例では、図16(a)に示すサブGOPメディアセグメントの構成データを4つのHTTPパケット(b1)〜(b4)に分割した例を示している。
(b1)〜(b4)に示す4つのNALユニットフラグメント対応HTTPパケットの各々は、このHTTPパケットを図15に示すMACフレーム構成とした場合、MACヘッダ以外のデータ部のデータ量が1500バイト以下になるようなデータ量に設定する。
In the example illustrated in FIG. 16, the configuration data of the sub GOP media segment illustrated in FIG. 16A is divided into four HTTP packets (b1) to (b4).
Each of the four NAL unit fragment-corresponding HTTP packets shown in (b1) to (b4) has a data amount other than the MAC header of 1500 bytes or less when the HTTP packet has the MAC frame configuration shown in FIG. Set the amount of data as follows.
図16の(b1)に示すNALユニットフラグメント対応HTTPパケットは、(a)に示すサブGOPメディアセグメントのメタデータ領域、すなわち、msdh(stype)、sidx、moof、これらのメタデータを格納したHTTPパケットである。すなわちメタデータ格納型NALユニットフラグメント対応HTTPパケットである。 The HTTP packet corresponding to the NAL unit fragment shown in (b1) of FIG. 16 is the metadata area of the sub GOP media segment shown in (a), that is, the msdh (type), sidx, moof, and HTTP packets storing these metadata. It is. That is, it is a metadata storage type NAL unit fragment compatible HTTP packet.
また、図16(b2)〜(b4)に示すNALユニットフラグメント対応HTTPパケットは、(a)に示すサブGOPメディアセグメントのメディアデータ(mdat)領域のNALユニットを分割して生成したNALフラグメント(NALf)を格納したHTTPパケットである。すなわちメディアデータ格納型NALユニットフラグメント対応HTTPパケットである。 Also, the HTTP packets corresponding to the NAL unit fragments shown in FIGS. 16B2 to 16B4 are generated by dividing the NAL unit in the media data (mdat) area of the sub GOP media segment shown in FIG. ) Is stored in the HTTP packet. That is, it is a media data storage type NAL unit fragment compatible HTTP packet.
なお、図16(a)に示すサブGOPメディアセグメントに格納されたNALユニットは1つのみであるが、サブGOPメディアセグメントに格納されたNALユニットは図16(a)に示すように1つのNALユニットである場合と、2つ以上の複数のNALユニットである場合がある。NALユニットフラグメントの構成データは、1つのNALユニットのみに限らず、複数のNALユニットに跨ったデータとしてもよい。例えば先行するNALユニットの後半部分と、後続のNALユニットの先頭部分をあわせて1つのNALユニットフラグメントを設定するといった構成も可能である。 Note that only one NAL unit is stored in the sub GOP media segment shown in FIG. 16 (a), but one NAL unit is stored in the sub GOP media segment as shown in FIG. 16 (a). It may be a unit, or it may be two or more NAL units. The configuration data of the NAL unit fragment is not limited to one NAL unit, and may be data extending over a plurality of NAL units. For example, a configuration in which one NAL unit fragment is set by combining the latter half of the preceding NAL unit and the beginning of the subsequent NAL unit is also possible.
送信装置20は、このように1つのサブGOPメディアセグメントを分割して複数のHTTPパケットを生成して、これらのHTTPパケットからさらにIPパケットを生成し、順次送信する。
The
しかし、このように本来の1つのNALユニットやその属性情報が分割されて配信されると、受信装置30側で復号、再生処理を行うためには、NALユニットとその属性情報を再構築する必要がある。
このために必要となる情報を付加情報としてHTTPヘッダに記録する。
However, when one original NAL unit and its attribute information are divided and distributed in this way, it is necessary to reconstruct the NAL unit and its attribute information in order to perform decoding and reproduction processing on the receiving
Information necessary for this is recorded in the HTTP header as additional information.
図16(b1)に示すメタデータ格納型NALユニットフラグメント対応HTTPパケットのHTTPヘッダには、以下の付加情報を記録する。
*NALユニットフラグメントヘッダ[X−NALUFragmentSubSegmentHeader]
*ムービーフラグメントシーケンス番号[X−MovieFragmentSequenceNumber]
*アクセスポイント情報[X−SAP]
The following additional information is recorded in the HTTP header of the metadata storing type NAL unit fragment correspondence HTTP packet shown in FIG.
* NAL unit fragment header [X-NALUFragmentSubSegmentHeader]
* Movie fragment sequence number [X-MovieFragmentSequenceNumber]
* Access point information [X-SAP]
NALユニットフラグメントヘッダは、そのHTTPパケットが、
メタデータ格納型NALユニットフラグメント対応HTTPパケットであるか、
メディアデータ格納型NALユニットフラグメント対応HTTPパケットであるか、
を識別するための識別情報である。
The NAL unit fragment header contains the HTTP packet
Whether the metadata storage type NAL unit fragment compatible HTTP packet,
Whether it is a media data storage type NAL unit fragment compatible HTTP packet,
This is identification information for identifying.
ムービーフラグメントシーケンス番号は、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号であり、サブGOPメディアセグメントに格納されたNALユニットの配列情報である。このシーケンス番号は、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号をそのままコピーして記録する。 The movie fragment sequence number is a sequence number recorded in the metadata (moof) of the sub GOP media segment before the division, and is sequence information of the NAL unit stored in the sub GOP media segment. As this sequence number, the sequence number recorded in the metadata (moof) of the sub GOP media segment before division is copied and recorded as it is.
アクセスポイント情報は、このHTTPパケットの生成元となったサブGOPセグメント(図16(a)のサブGOPメディアセグメント)に格納されたNALユニットにランダムアクセスポイントとなるデータが含まれるか否かを示す情報である。
受信装置は、このアクセスポイント情報(X−SAP)を参照することで、そのHTTPパケットが、ランダムアクセスポイントとなるNALユニットを含むサブGOPセグメントの構成データに基づいて生成されたデータであるか否かを即座に判別することができる。
The access point information indicates whether data serving as a random access point is included in the NAL unit stored in the sub GOP segment (sub GOP media segment in FIG. 16A) from which the HTTP packet is generated. Information.
By referring to this access point information (X-SAP), the receiving apparatus determines whether the HTTP packet is data generated based on the configuration data of the sub GOP segment including the NAL unit serving as a random access point. Can be immediately determined.
なお、この図16(b1)のメタデータ格納型NALユニットフラグメント対応HTTPパケットのHTTPヘッダに記録されたアクセスポイント情報(X−SAP)が、パケット生成元のサブGOPセグメントにアクセスポイントデータを含むことを示す場合、メタデータである[sidx]を参照することで、SAP、すなわちランダムアクセスポイントの符号化データの位置を取得することが可能となる。 It should be noted that the access point information (X-SAP) recorded in the HTTP header of the metadata storing type NAL unit fragment compatible HTTP packet of FIG. 16 (b1) includes the access point data in the sub GOP segment of the packet generation source. , By referring to [sidx] that is metadata, it is possible to acquire the position of the encoded data of the SAP, that is, the random access point.
一方、図16(b2)〜(b4)に示すメディアデータ格納型NALユニットフラグメント対応HTTPパケットのHTTPヘッダには、以下の付加情報を記録する。
*ムービーフラグメントシーケンス番号[X−MovieFragmentSequenceNumber]
*NALユニット内位置識別情報[X−NALUFragmentIndicator]
*アクセスポイント情報[X−SAP]
On the other hand, the following additional information is recorded in the HTTP header of the media data storage type NAL unit fragment compatible HTTP packet shown in FIGS. 16 (b2) to (b4).
* Movie fragment sequence number [X-MovieFragmentSequenceNumber]
* Position identification information in the NAL unit [X-NALUFragmentIndicator]
* Access point information [X-SAP]
ムービーフラグメントシーケンス番号は、上述したように、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号であり、サブGOPメディアセグメントに格納されたNALユニットの配列情報である。このシーケンス番号は、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号をそのままコピーして記録する。 As described above, the movie fragment sequence number is a sequence number recorded in the metadata (moof) of the sub GOP media segment before the division, and is sequence information of the NAL unit stored in the sub GOP media segment. As this sequence number, the sequence number recorded in the metadata (moof) of the sub GOP media segment before division is copied and recorded as it is.
NALユニット内位置識別情報は、パケットに格納したNALユニットフラグメント(NALf)が、分割前のNALユニットのどの位置に対応するフラグメントであるかを示す情報である。
NALユニット内位置識別情報=X−StartNALUFragmentSubSegmentであるパケットは、分割前のNALユニットの先頭領域のNALユニットフラグメント(NALf)をメディアデータ(mdat)として格納したパケットである。
NALユニット内位置識別情報=X−MiddleNALUFragmentSubSegmentであるパケットは、分割前のNALユニットの中間領域のNALユニットフラグメント(NALf)をメディアデータ(mdat)として格納したパケットである。
NALユニット内位置識別情報=X−EndNALUFragmentSubSegmentであるパケットは、分割前のNALユニットの末尾領域のNALユニットフラグメント(NALf)をメディアデータ(mdat)として格納したパケットである。
The intra-NAL unit position identification information is information indicating the position of the NAL unit fragment (NALf) stored in the packet corresponding to the position of the NAL unit before division.
A packet with NAL unit position identification information = X-StartNALUFragmentSubSegment is a packet in which the NAL unit fragment (NALf) of the head area of the NAL unit before division is stored as media data (mdat).
The packet with NAL unit position identification information = X-Middle NALU Fragment SubSegment is a packet in which the NAL unit fragment (NALf) in the intermediate area of the NAL unit before division is stored as media data (mdat).
A packet with NAL unit position identification information = X-EndNALUFragmentSubSegment is a packet in which the NAL unit fragment (NALf) of the end area of the NAL unit before division is stored as media data (mdat).
なお、1つのサブGOPメディアセグメントに格納されたNALユニットが、4つ以上のメディアデータ格納型NALユニットフラグメント対応HTTPパケットに分割された場合、NALユニット内位置識別情報=X−MiddleNALUFragmentSubSegmentを設定した複数のパケットが生成されることになる。これらのパケットに格納されるメディアデータ(mdat)のNALユニットフラグメント(NALf)の配列は、HTTPヘッダ以外のパケットヘッダ情報によって判別できる。
例えばHTTPパケットを格納するLCTパケットのLCTヘッダに記録されるパケットシーケンス番号を参照することで判別可能である。なお、具体的な送信パケットの構成、およびLCTヘッダ構成については、後述する。
When a NAL unit stored in one sub GOP media segment is divided into four or more media data storage type NAL unit fragment compatible HTTP packets, a plurality of NAL unit location identification information = X-Middle NALUFragmentSubSegment is set Will be generated. The arrangement of NAL unit fragments (NALf) of media data (mdat) stored in these packets can be determined by packet header information other than the HTTP header.
For example, it can be determined by referring to the packet sequence number recorded in the LCT header of the LCT packet storing the HTTP packet. A specific transmission packet configuration and an LCT header configuration will be described later.
従って、例えばHTTPパケットをLCTパケットに格納して送信する構成では、HTTPヘッダに設定するNALユニット内位置識別情報は、位置が先頭領域のデータを格納したパケットのみを識別する設定としてもよい。すなわち、NALユニット内位置識別情報=X−StartNALUFragmentSubSegmentのみを記録し、この後に続くデータは、LCTヘッダのシーケンス番号を参照して配列する構成としてもよい。 Therefore, for example, in a configuration in which an HTTP packet is stored in an LCT packet and transmitted, the intra-NAL unit position identification information set in the HTTP header may be set so as to identify only the packet storing the data in the head area. That is, only NAL unit position identification information = X-StartNALUFragmentSubSegment may be recorded, and subsequent data may be arranged with reference to the sequence number of the LCT header.
アクセスポイント情報は、このHTTPパケットの生成元となったサブGOPセグメント(図16(a)のサブGOPメディアセグメント)に格納されたNALユニットにランダムアクセスポイントとなるデータが含まれるか否かを示す情報である。
受信装置は、このアクセスポイント情報(X−SAP)を参照することで、そのHTTPパケットが、ランダムアクセスポイントとなるNALユニットを含むサブGOPセグメントの構成データに基づいて生成されたデータであるか否かを即座に判別することができる。
The access point information indicates whether data serving as a random access point is included in the NAL unit stored in the sub GOP segment (sub GOP media segment in FIG. 16A) from which the HTTP packet is generated. Information.
By referring to this access point information (X-SAP), the receiving apparatus determines whether the HTTP packet is data generated based on the configuration data of the sub GOP segment including the NAL unit serving as a random access point. Can be immediately determined.
図17に、メタデータ格納型NALユニットフラグメント対応HTTPパケットの構成とHTTPヘッダのデータ構成例を示す。
図17に示すようにHTTPヘッダには、例えば以下のHTTPヘッダ情報が記録される。
「・・・
HTTP/1.1 206 Partial Content
Date: Fri, 04 Oct 2013 11:14:20 GMT
Content−type: application/mp4
X−NALUFragmentSubSegmentHeader
X−MovieFragmentSequenceNumber:234567
X−SAP
・・・」
FIG. 17 shows a configuration of an HTTP packet corresponding to a metadata storage type NAL unit fragment and a data configuration example of an HTTP header.
As shown in FIG. 17, for example, the following HTTP header information is recorded in the HTTP header.
"...
HTTP / 1.1 206 Partial Content
Date: Fri, 04
Content-type: application / mp4
X-NALUFragmentSubSegmentHeader
X-MovieFragmentSequenceNumber: 234567
X-SAP
... "
上記のHTTPヘッダ情報中、
NALユニットフラグメントヘッダは、
「X−NALUFragmentSubSegmentHeader」
である。
このNALユニットフラグメントヘッダは、このHTTPパケットが、メタデータ格納型NALユニットフラグメント対応HTTPパケットであることを示す情報として記録される。
In the above HTTP header information,
The NAL unit fragment header is
"X-NALUFragmentSubSegmentHeader"
It is.
The NAL unit fragment header is recorded as information indicating that the HTTP packet is a metadata storage type NAL unit fragment compatible HTTP packet.
また、上記のHTTPヘッダ情報中、
ムービーフラグメントシーケンス番号は、
「X−MovieFragmentSequenceNumber」
である。
このムービーフラグメントシーケンス番号は、上述したように、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号であり、サブGOPメディアセグメントに格納されたNALユニットの配列情報である。このシーケンス番号は、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号をそのままコピーして記録する。
In the above HTTP header information,
The movie fragment sequence number is
"X-MovieFragmentSequenceNumber"
It is.
As described above, this movie fragment sequence number is a sequence number recorded in the metadata (moof) of the sub GOP media segment before division, and is the sequence information of the NAL unit stored in the sub GOP media segment. As this sequence number, the sequence number recorded in the metadata (moof) of the sub GOP media segment before division is copied and recorded as it is.
また、上記のHTTPヘッダ情報中、
アクセスポイント情報は、
「X−SAP」
である。
このアクセスポイント情報は、このHTTPパケットの生成元となったサブGOPセグメントに格納されたNALユニットにランダムアクセスポイントとなるデータが含まれるか否かを示す情報である。
In the above HTTP header information,
Access point information
"X-SAP"
It is.
This access point information is information indicating whether or not data serving as a random access point is included in the NAL unit stored in the sub GOP segment from which the HTTP packet is generated.
次に、図18を参照して、メディアデータを格納するメディアデータ格納型NALユニットフラグメント対応HTTPパケットの構成とHTTPヘッダのデータ構成例について説明する。
図18に示すようにHTTPヘッダには、例えば以下のHTTPヘッダ情報が記録される。
「・・・
HTTP/1.1 206 Partial Content
Date: Fri, 04 Oct 2013 11:14:20 GMT
Content−type: application/mp4
X−StartOfGOP
X−MovieFragmentSequenceNumber:234567
X−StartNALUFragmentSubSegment
X−SAP
・・・」
Next, a configuration of a media data storage type NAL unit fragment compatible HTTP packet for storing media data and a data configuration example of an HTTP header will be described with reference to FIG.
As shown in FIG. 18, for example, the following HTTP header information is recorded in the HTTP header.
"...
HTTP / 1.1 206 Partial Content
Date: Fri, 04
Content-type: application / mp4
X-StartOfGOP
X-MovieFragmentSequenceNumber: 234567
X-StartNALUFragmentSubSegment
X-SAP
... "
上記のHTTPヘッダ情報中、
GOP内位識別情報は、
「X−StartOfGOP」
である。このGOP内位識別情報は、HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPのどの位置にあるかを示すデータである。
先頭領域の場合は、「X−StartOfGOP」、
中間領域の場合は、「X−MiddleOfGOP」、
末尾領域の場合は、「X−EndOfGOP」、
HTTPヘッダにはこれらのいずれかのデータがGOP内位識別情報として記録される。
In the above HTTP header information,
The GOP internal identification information is
"X-StartOfGOP"
It is. This GOP in-position identification information is data indicating where in one GOP the media data (mdat) stored in the HTTP packet is located.
In the case of the top area, “X-StartOfGOP”,
In the case of an intermediate area, “X-MiddleOfGOP”,
In the case of the end region, “X-EndOfGOP”,
Any one of these data is recorded in the HTTP header as GOP in-line identification information.
また、上記のHTTPヘッダ情報中、
ムービーフラグメントシーケンス番号は、
「X−MovieFragmentSequenceNumber」
である。
このムービーフラグメントシーケンス番号は、上述したように、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号であり、サブGOPメディアセグメントに格納されたNALユニットの配列情報である。このシーケンス番号は、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号をそのままコピーして記録する。
In the above HTTP header information,
The movie fragment sequence number is
"X-MovieFragmentSequenceNumber"
It is.
As described above, this movie fragment sequence number is a sequence number recorded in the metadata (moof) of the sub GOP media segment before division, and is the sequence information of the NAL unit stored in the sub GOP media segment. As this sequence number, the sequence number recorded in the metadata (moof) of the sub GOP media segment before division is copied and recorded as it is.
また、上記のHTTPヘッダ情報中、
NALユニット内位置識別情報は、
「X−StartNALUFragmentSubSegment」
である。
このNALユニット内位置識別情報は、パケットに格納したNALユニットフラグメント(NALf)が、分割前のNALユニットのどの位置に対応するフラグメントであるかを示す情報である。
In the above HTTP header information,
The position identification information in the NAL unit is
"X-StartNALUFragmentSubSegment"
It is.
This intra-NAL unit position identification information is information indicating to which position of the NAL unit before the division the NAL unit fragment (NALf) stored in the packet.
NALユニット内位置識別情報=X−StartNALUFragmentSubSegmentであるパケットは、分割前のNALユニットの先頭領域のNALユニットフラグメント(NALf)をメディアデータ(mdat)として格納したパケットである。
NALユニット内位置識別情報=X−MiddleNALUFragmentSubSegmentであるパケットは、分割前のNALユニットの中間領域のNALユニットフラグメント(NALf)をメディアデータ(mdat)として格納したパケットである。
NALユニット内位置識別情報=X−EndNALUFragmentSubSegmentであるパケットは、分割前のNALユニットの末尾領域のNALユニットフラグメント(NALf)をメディアデータ(mdat)として格納したパケットである。
A packet with NAL unit position identification information = X-StartNALUFragmentSubSegment is a packet in which the NAL unit fragment (NALf) of the head area of the NAL unit before division is stored as media data (mdat).
The packet with NAL unit position identification information = X-Middle NALU Fragment SubSegment is a packet in which the NAL unit fragment (NALf) in the intermediate area of the NAL unit before division is stored as media data (mdat).
A packet with NAL unit position identification information = X-EndNALUFragmentSubSegment is a packet in which the NAL unit fragment (NALf) of the end area of the NAL unit before division is stored as media data (mdat).
また、上記のHTTPヘッダ情報中、
アクセスポイント情報は、
「X−SAP」
である。
このアクセスポイント情報は、このHTTPパケットの生成元となったサブGOPセグメントに格納されたNALユニットにランダムアクセスポイントとなるデータが含まれるか否かを示す情報である。
In the above HTTP header information,
Access point information
"X-SAP"
It is.
This access point information is information indicating whether or not data serving as a random access point is included in the NAL unit stored in the sub GOP segment from which the HTTP packet is generated.
[9.送信装置と受信装置の処理シーケンスについて]
次に、図19、図20に示すフローチャートを参照して送信装置と受信装置の実行する処理シーケンスについて説明する。
[9. Processing sequence of transmitting device and receiving device]
Next, a processing sequence executed by the transmission device and the reception device will be described with reference to the flowcharts shown in FIGS.
まず、図19に示すフローチャートを参照して送信装置20の実行する処理シーケンスについて説明する。
図19に示すフローは、図16を参照して説明した例えば図16(a)に示すサブGOPメディアセグメントに基づいて生成するメタデータ格納型NALユニットフラグメント対応HTTPパケット、あるいはメディアデータ格納型NALユニットフラグメント対応HTTPパケットの生成と送信処理のシーケンスを説明するフローである。
この処理は、送信装置20のデータ処理部において実行する。データ処理部は、プログラム実行機能を有するCPUを備え、例えば記憶部に格納されたプログラムに従って、図19に示すフローに従った処理を実行する。
以下、各ステップの処理について、順次、説明する。
First, the processing sequence executed by the
The flow shown in FIG. 19 is the metadata storage type NAL unit fragment corresponding HTTP packet generated based on the sub GOP media segment shown in FIG. 16A described with reference to FIG. 16, or the media data storage type NAL unit. It is a flow explaining the generation | occurrence | production of a fragment corresponding | compatible HTTP packet, and the sequence of a transmission process.
This processing is executed in the data processing unit of the
Hereinafter, the processing of each step will be described sequentially.
(ステップS101)
まず、送信装置のデータ処理部は、送信対象となるコンテンツの符号化処理を実行する。例えばMP4ファイルフォーマットに従った符号化処理を実行する。
(Step S101)
First, the data processing unit of the transmission device executes encoding processing of content to be transmitted. For example, an encoding process according to the MP4 file format is executed.
(ステップS102)
次に、送信装置は、サブGOPメディアセグメント対応のメディアデータ(mdat)を生成する。この処理は、先に図5他を参照して説明したサブGOPメディアセグメントに格納するメディアデータ(mdat)を生成する処理である。MP4符号化データであるGOPデータの一部、すなわちGOPを構成する1つ以上のNALユニットを構成データとするメディアデータ(mdat)を生成する。
(Step S102)
Next, the transmission apparatus generates media data (mdat) corresponding to the sub GOP media segment. This process is a process for generating media data (mdat) to be stored in the sub GOP media segment described above with reference to FIG. Media data (mdat) including a part of GOP data which is MP4 encoded data, that is, one or more NAL units constituting the GOP, is generated.
(ステップS103)
次に、送信装置は、ステップS102で生成したメディアデータ(mdat)に対応する属性情報であるメタデータ(moof)を生成する。
(Step S103)
Next, the transmission apparatus generates metadata (moof) that is attribute information corresponding to the media data (mdat) generated in step S102.
(ステップS104)
次に、送信装置は、サブGOPメディアセグメントに対応するメタデータであるmsdh、sidxを生成する。先に図5他を参照して説明したサブGOPメディアセグメントに格納するメタデータである。
(Step S104)
Next, the transmission apparatus generates msdh and sidx, which are metadata corresponding to the sub GOP media segment. This metadata is stored in the sub GOP media segment described above with reference to FIG.
(ステップS105)
次に、送信装置は、サブGOPメディアセグメント格納用のメタデータ(mdat)を分割してNALユニットフラグメント(Nalf)を生成する。なお、分割処理は、例えばMACフレームの一般的なMTUに従い、MACフレームとした場合のペイロードが約1500バイト以下となるように分割処理を実行する。
(Step S105)
Next, the transmission apparatus divides the metadata (mdat) for storing the sub GOP media segment to generate a NAL unit fragment (Nalf). For example, according to the general MTU of the MAC frame, the division process is performed such that the payload when the MAC frame is used is about 1500 bytes or less.
(ステップS106)
次に、送信装置は、メタデータ格納型NALユニットフラグメント対応HTTPパケットと、NALユニットフラグメントを格納したメディアデータ格納型NALユニットフラグメント対応HTTPパケットのパケットヘッダを生成する。
これは、先に図16、図17、図18を参照して説明したHTTPヘッダ情報の生成処理である。
(Step S106)
Next, the transmission apparatus generates a metadata storage type NAL unit fragment corresponding HTTP packet and a packet header of the media data storage type NAL unit fragment corresponding HTTP packet storing the NAL unit fragment.
This is the HTTP header information generation process described above with reference to FIGS. 16, 17, and 18.
メタデータ格納型NALユニットフラグメント対応HTTPパケットのHTTPヘッダには、以下の情報を記録する。
まず、このHTTPパケットがメタデータ格納型NALユニットフラグメント対応HTTPパケットであることを示すNALユニットフラグメントヘッダを記録する。
さらに、サブGOPメディアセグメントに格納されたNALユニットの配列情報に相当するムービーフラグメントシーケンス番号を記録する。このシーケンス番号は、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号をそのままコピーして記録する。
さらに、アクセスポイント情報「X−SAP」を記録する。
このアクセスポイント情報は、このHTTPパケットの生成元となったサブGOPセグメントに格納されたNALユニットにランダムアクセスポイントとなるデータが含まれるか否かを示す情報である。
The following information is recorded in the HTTP header of the metadata storing type NAL unit fragment compatible HTTP packet.
First, a NAL unit fragment header indicating that this HTTP packet is a metadata storing type NAL unit fragment compatible HTTP packet is recorded.
Furthermore, a movie fragment sequence number corresponding to the arrangement information of the NAL unit stored in the sub GOP media segment is recorded. As this sequence number, the sequence number recorded in the metadata (moof) of the sub GOP media segment before division is copied and recorded as it is.
Further, access point information “X-SAP” is recorded.
This access point information is information indicating whether or not data serving as a random access point is included in the NAL unit stored in the sub GOP segment from which the HTTP packet is generated.
一方、メディアデータ格納型NALユニットフラグメント対応HTTPパケットのパケットヘッダには以下の情報を記録する。
GOP内位識別情報:HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPのどの位置にあるかを示すデータであり、
先頭領域の場合は、「X−StartOfGOP」、
中間領域の場合は、「X−MiddleOfGOP」、
末尾領域の場合は、「X−EndOfGOP」、
これらのいずれかのデータを記録する。
On the other hand, the following information is recorded in the packet header of the media data storage type NAL unit fragment compatible HTTP packet.
GOP in-position identification information: data indicating where in one GOP the media data (mdat) stored in the HTTP packet is located,
In the case of the top area, “X-StartOfGOP”,
In the case of an intermediate area, “X-MiddleOfGOP”,
In the case of the end region, “X-EndOfGOP”,
Record any of these data.
ムービーフラグメントシーケンス番号:上述したように、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号であり、サブGOPメディアセグメントに格納されたNALユニットの配列情報である。このシーケンス番号は、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号をそのままコピーして記録する。 Movie fragment sequence number: As described above, this is the sequence number recorded in the metadata (moof) of the sub GOP media segment before division, and is the sequence information of the NAL unit stored in the sub GOP media segment. As this sequence number, the sequence number recorded in the metadata (moof) of the sub GOP media segment before division is copied and recorded as it is.
NALユニット内位置識別情報:パケットに格納したNALユニットフラグメント(NALf)が、分割前のNALユニットのどの位置に対応するフラグメントであるかを示す情報である。 In-NAL unit position identification information: Information indicating which position of the NAL unit fragment (NALf) stored in the packet corresponds to the position of the NAL unit before division.
アクセスポイント情報「X−SAP」:アクセスポイント情報は、このHTTPパケットの生成元となったサブGOPセグメントに格納されたNALユニットにランダムアクセスポイントとなるデータが含まれるか否かを示す情報である。 Access point information “X-SAP”: The access point information is information indicating whether data serving as a random access point is included in the NAL unit stored in the sub GOP segment from which the HTTP packet is generated. .
送信装置は、ステップS106において、上記のように、メタデータ格納型NALユニットフラグメント対応HTTPパケットと、NALユニットフラグメントを格納したメディアデータ格納型NALユニットフラグメント対応HTTPパケットのパケットヘッダを生成する。 In step S106, the transmission apparatus generates a packet header of the metadata storage type NAL unit fragment correspondence HTTP packet and the media data storage type NAL unit fragment correspondence HTTP packet storing the NAL unit fragment as described above.
(ステップS107)
次に、送信装置は、ステップS107においてステップS106で生成したHTTPヘッダを設定した以下のHTTTPパケットを生成する。
メタデータ格納型NALユニットフラグメント対応HTTPパケット
メディアデータ格納型NALユニットフラグメント対応HTTPパケット
これらの各HTTPパケットを生成する。
(Step S107)
Next, the transmission apparatus generates the following HTTP packet in which the HTTP header generated in step S106 is set in step S107.
Metadata storing type NAL unit fragment corresponding HTTP packet Media data storing type NAL unit fragment corresponding HTTP packet Each of these HTTP packets is generated.
(ステップS108〜S109)
次に、送信装置は、生成したHTTPパケットに対して、LCTヘッダ、UDPヘッダ、IPヘッダを設定してIPパケットを生成して送信する。送信処理は、インターネット等の通信ネットワークまたは放送波のいずれか、または両通信路を介して実行する。
(Steps S108 to S109)
Next, the transmission device sets an LCT header, a UDP header, and an IP header for the generated HTTP packet, and generates and transmits an IP packet. The transmission processing is executed via either a communication network such as the Internet or broadcast waves, or both communication paths.
なお、図19に示すフローは、メディアセグメントに基づいて生成するパケットの生成と送信処理シーケンスを説明するフローである。初期化セグメントに基づくパケット生成に際しては、初期化セグメントの構成データの生成の後、HTTPヘッダに初期化セグメントであることを示すセグメント識別子を記録する処理などを行なうことになる。 Note that the flow shown in FIG. 19 is a flow for explaining the generation of a packet generated based on the media segment and the transmission processing sequence. When generating a packet based on the initialization segment, after generating the configuration data of the initialization segment, a process of recording a segment identifier indicating the initialization segment in the HTTP header is performed.
次に、図20、図21に示すフローチャートを参照して受信装置において実行するパケット受信からコンテンツ再生に至るまでの処理シーケンスについて説明する。
この処理は、受信装置30のデータ処理部において実行する。データ処理部は、プログラム実行機能を有するCPUを備え、例えば記憶部に格納されたプログラムに従って、図20〜図21に示すフローに従った処理を実行する。
以下、各ステップの処理について、順次、説明する。
Next, a processing sequence from packet reception to content reproduction executed in the receiving apparatus will be described with reference to flowcharts shown in FIGS.
This process is executed in the data processing unit of the receiving
Hereinafter, the processing of each step will be described sequentially.
(ステップS201)
まず、ステップS201において、受信装置は、ユーザによる再生コンテンツの指定情報を入力する。例えば予め送信装置から受信している番組表等のコンテンツ一覧リストを表示部に表示し、この表示情報に対するユーザ入力情報に基づいて再生コンテンツを決定する。
(Step S201)
First, in step S201, the receiving apparatus inputs reproduction content designation information by the user. For example, a content list such as a program guide received in advance from the transmission device is displayed on the display unit, and the playback content is determined based on user input information for this display information.
(ステップS202)
次に受信装置は、再生対象として選択された選択コンテンツに対応する初期化セグメントを含むパケットを受信して初期化セグメントを取得する。
なお、先に図9を参照して説明したように初期化セグメントを格納したHTTPパケットのHTTPヘッダには、セグメント識別情報が記録されており、この識別情報を参照することで初期化セグメントを格納したHTTPパケットであることが確認できる。
(Step S202)
Next, the receiving device receives the packet including the initialization segment corresponding to the selected content selected as the reproduction target, and acquires the initialization segment.
As described above with reference to FIG. 9, segment identification information is recorded in the HTTP header of the HTTP packet storing the initialization segment, and the initialization segment is stored by referring to this identification information. It can be confirmed that this is an HTTP packet.
(ステップS203)
受信装置は、受信した初期化セグメントの格納データに従って受信装置の初期化処理を実行する。具体的には初期化セグメントに格納されたコーデック設定パラメータ等を取得し、取得パラメータに従ってコーデックの設定等を行う。
(Step S203)
The receiving device executes initialization processing of the receiving device according to the received storage data of the initialization segment. Specifically, the codec setting parameters and the like stored in the initialization segment are acquired, and codec settings and the like are performed according to the acquisition parameters.
(ステップS204)
次に、受信装置は、ステップS201で選択した選択コンテンツに対応するサブGOPメディアセグメントの分割パケットである以下のパケットを受信する。
メタデータ格納型NALユニットフラグメント対応HTTPパケットを格納したIPパケット、
メディアデータ格納型NALユニットフラグメント対応HTTPパケットを格納したIPパケット、
これらの各パケットを受信する。
(Step S204)
Next, the receiving apparatus receives the following packet, which is a divided packet of the sub GOP media segment corresponding to the selected content selected in step S201.
An IP packet storing an HTTP packet corresponding to a metadata storage type NAL unit fragment;
IP packet storing media data storage type NAL unit fragment compatible HTTP packet,
Each of these packets is received.
(ステップS205)
次に、受信装置は、受信パケットのHTTPヘッダからパケットに格納されたデータの以下の属性情報を取得する。
*NALユニットフラグメントヘッダ
*GOP内位置識別情報
*ムービーフラグメントシーケンス番号
*NALユニット内位置識別情報
*アクセスポイント情報
(Step S205)
Next, the receiving apparatus acquires the following attribute information of the data stored in the packet from the HTTP header of the received packet.
* NAL unit fragment header * GOP position identification information * Movie fragment sequence number * NAL unit position identification information * Access point information
上述したように、NALユニットフラグメントヘッダは、HTTPパケットがメタデータ格納型NALユニットフラグメント対応HTTPパケットであることを示す情報である。
GOP内位識別情報は、HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPのどの位置にあるかを示すデータである。
ムービーフラグメントシーケンス番号は、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号であり、サブGOPメディアセグメントに格納されたNALユニットの配列情報である。
NALユニット内位置識別情報は、パケットに格納したNALユニットフラグメント(NALf)が、分割前のNALユニットのどの位置に対応するフラグメントであるかを示す情報である。
アクセスポイント情報「X−SAP」は、このHTTPパケットの生成元となったサブGOPセグメントに格納されたNALユニットにランダムアクセスポイントとなるデータが含まれるか否かを示す情報である。
As described above, the NAL unit fragment header is information indicating that the HTTP packet is a metadata storage type NAL unit fragment compatible HTTP packet.
The GOP in-position identification information is data indicating where in one GOP the media data (mdat) stored in the HTTP packet is located.
The movie fragment sequence number is a sequence number recorded in the metadata (moof) of the sub GOP media segment before the division, and is sequence information of the NAL unit stored in the sub GOP media segment.
The intra-NAL unit position identification information is information indicating the position of the NAL unit fragment (NALf) stored in the packet corresponding to the position of the NAL unit before division.
The access point information “X-SAP” is information indicating whether or not data serving as a random access point is included in the NAL unit stored in the sub-GOP segment from which the HTTP packet is generated.
(ステップS206)
次に、受信装置は、ステップS206において、アクセスポイントデータを優先して復号、再生を行なう特殊再生を実行するか否かを判定する。
例えば、ランダムアクセス再生処理などのコンテンツ途中からの再生処理などの特殊再生処理を実行するか否かを判定する。この判定処理はユーザの入力情報等に基づいて決定する。
特殊再生処理を実行する場合は、ステップS207に進む。通常再生処理を実行する場合はステップS208に進む。
(Step S206)
Next, in step S206, the receiving apparatus determines whether or not to execute special reproduction in which access point data is preferentially decoded and reproduced.
For example, it is determined whether or not to execute special playback processing such as playback processing from the middle of content such as random access playback processing. This determination process is determined based on user input information or the like.
When the special reproduction process is executed, the process proceeds to step S207. When the normal reproduction process is executed, the process proceeds to step S208.
(ステップS207)
ステップS206において、ランダムアクセス再生処理などの特殊再生処理を実行すると判定した場合ステップS207に進む。ステップS207では、パケットのHTTPヘッダに記録されたアクセスポイント情報[X−SAP]が、アクセスポイントありのデータを示すパケットを選択する。すなわち、HTTPパケットの生成元となったサブGOPセグメントに格納されたNALユニットにランダムアクセスポイントとなるデータが含まれることを示すパケットを復号対象として選択して、復号処理を実行して再生処理を行なう。
この場合、GOP全体を揃えることなく復号再生することが可能となる。
ステップS207の処理の後、ステップS211に進む。
(Step S207)
If it is determined in step S206 that special reproduction processing such as random access reproduction processing is to be executed, the process proceeds to step S207. In step S207, the access point information [X-SAP] recorded in the HTTP header of the packet selects a packet indicating data with an access point. That is, a packet indicating that the NAL unit stored in the sub GOP segment from which the HTTP packet is generated includes data serving as a random access point is selected as a decoding target, the decoding process is executed, and the reproduction process is performed. Do.
In this case, decoding and reproduction can be performed without arranging the entire GOP.
It progresses to step S211 after the process of step S207.
(ステップS208)
一方、ステップS206において、ランダムアクセス再生処理などの特殊再生処理を実行せず、通常再生処理を実行すると判定した場合ステップS208に進む。ステップS208では、受信装置は、HTTPヘッダから取得した識別情報に従って、受信した複数のメディアデータ格納型NALユニットフラグメント対応HTTPパケットに格納されたNALユニットフラグメントを再配列し、GOP単位データ再構築する。
(Step S208)
On the other hand, if it is determined in step S206 that the special reproduction process such as the random access reproduction process is not performed and the normal reproduction process is performed, the process proceeds to step S208. In step S208, the receiving apparatus rearranges the NAL unit fragments stored in the received plurality of media data storage type NAL unit fragment corresponding HTTP packets according to the identification information acquired from the HTTP header, and reconstructs GOP unit data.
(ステップS209〜S210)
次に、受信装置は、再構築したGOPデータに対する復号処理を実行し、復号データの再生処理を行なう。
(Steps S209 to S210)
Next, the receiving apparatus performs a decoding process on the reconstructed GOP data, and performs a reproduction process of the decoded data.
(ステップS211)
次に、受信装置は、データ再生処理が終了したか否かを判定し、終了していない場合は、ステップS204に戻り、ステップS204以下の処理を繰り返し実行する。
ステップS211において再生処理終了と判定した場合は処理を終了する。
(Step S211)
Next, the receiving apparatus determines whether or not the data reproduction process has been completed. If the data reproduction process has not been completed, the receiving apparatus returns to step S204, and repeatedly executes the processes from step S204.
If it is determined in step S211 that the reproduction process has ended, the process ends.
なお、例えばランダムアクセス再生等、特定の再生位置の画像のみを再生する場合には、メタデータ格納型NALユニットフラグメント対応HTTPパケットにランダムアクセスポイント情報であるsidxデータを参照し、sidxデータから算出される1以上のNALユニットフラグメント(NALf)のみを処理対象として処理を行なうことができる。すなわち例えばIピクチャに相当する符号化画像データのみを選択して、これを復号して再生する処理を実行する。
この場合、GOP全体データを再配列する処理を行なうことなくランダムアクセスポイントのデータのみを選択して再生することが可能である。
For example, when only an image at a specific reproduction position is reproduced, such as random access reproduction, the metadata storage type NAL unit fragment compatible HTTP packet is referred to sidx data that is random access point information and is calculated from the sidx data. Only one or more NAL unit fragments (NALf) can be processed. That is, for example, only encoded image data corresponding to an I picture is selected, and a process of decoding and reproducing this is executed.
In this case, it is possible to select and reproduce only the data of the random access point without performing the process of rearranging the entire GOP data.
[10.拡張ヘッダに付加情報を記録した実施例について]
上述した実施例では、NALユニットフラグメント(NALf)の配列やGOP再構成処理に適用する情報、さらにアクセスポイント情報等、受信装置側における処理をスムーズに実行させるための付加情報をHTTPパケットに設定した実施例について説明した。
しかし、付加情報の記録先はHTTPヘッダに限らず、様々な記録先とすることが可能である。
以下、拡張ヘッダに付加情報を記録した実施例について説明する。
[10. Example in which additional information is recorded in extension header]
In the above-described embodiment, additional information for smoothly executing processing on the receiving apparatus side, such as information applied to NAL unit fragment (NALf) arrangement, GOP reconfiguration processing, and access point information, is set in the HTTP packet. Examples have been described.
However, the recording destination of the additional information is not limited to the HTTP header, and various recording destinations can be used.
Hereinafter, an embodiment in which additional information is recorded in the extension header will be described.
図22、図23を参照して、拡張ヘッダに付加情報を記録した実施例について説明する。
図22、図23に示す例は、HTTPヘッダに後続するパケット領域に新たな拡張ヘッダを挿入し、この拡張ヘッダに付加情報を記録した例である。
With reference to FIGS. 22 and 23, an embodiment in which additional information is recorded in the extension header will be described.
The example shown in FIGS. 22 and 23 is an example in which a new extension header is inserted into the packet area following the HTTP header, and additional information is recorded in the extension header.
図22には、
拡張ヘッダに記録する付加情報のリストを示しており、図23には、拡張ヘッダを有する3種類のHTTPパケットの例を示している。
図23には、
(1)初期化セグメントHTTPパケット、
(2)メディアセグメントベースのメタデータ格納型NALユニットフラグメント対応HTTPパケット、
(3)メディアセグメントベースのメディアデータ格納型NALユニットフラグメント対応HTTPパケット、
これらの3種類のHTTPパケットの例を示している。
各パケットのHTTPヘッダの次に拡張ヘッダを設定している。
In FIG.
A list of additional information to be recorded in the extension header is shown, and FIG. 23 shows an example of three types of HTTP packets having an extension header.
In FIG.
(1) Initialization segment HTTP packet,
(2) Media segment-based metadata storage type NAL unit fragment compatible HTTP packet,
(3) Media segment-based media data storage type NAL unit fragment compatible HTTP packet,
Examples of these three types of HTTP packets are shown.
An extension header is set after the HTTP header of each packet.
この拡張ヘッダに、図22に示すリストに従った付加情報を記録する。記録する付加情報の例について、図22を参照して説明する。図22に示すように付加情報は以下の情報から構成される。
(a)セグメント識別情報(Initialization Segment Identifier)、
(b)GOP内位置識別情報(Sub GOP Indicator)、
(c)ムービーフラグメントシーケンス番号(Movie Fragment Sequence Number)、
(d)NALユニットフラグメントヘッダ(NALU Fragment Sub Segment Header)、
(e)NALユニット内位置識別情報(NALU Fragment Identifier)
(f)アクセスポイント情報(SAPIndicator)
Additional information according to the list shown in FIG. 22 is recorded in this extension header. An example of additional information to be recorded will be described with reference to FIG. As shown in FIG. 22, the additional information includes the following information.
(A) Segment identification information (Initialization Segment Identifier),
(B) In-GOP position identification information (Sub GOP Indicator),
(C) Movie Fragment Sequence Number (Movie Fragment Sequence Number),
(D) NAL unit fragment header (NALU Fragment Sub Segment Header),
(E) NAL unit internal location identification information (NALU Fragment Identifier)
(F) Access point information (SAPIndicator)
例えば(a)セグメント識別情報は、8ビットデータとし、初期化セグメントの場合は1を設定し、その他のセグメントの場合は0を設定する。
なお、メディアセグメントの場合、HTTPヘッダに記録されるコンテンツ位置情報(ContentLocation)をGOP単位データの位置情報に設定すれば、このコンテンツ位置情報を参照することで各GOPデータの区別が可能となる。
For example, (a) segment identification information is 8-bit data, 1 is set for an initialization segment, and 0 is set for other segments.
In the case of a media segment, if the content location information (ContentLocation) recorded in the HTTP header is set as the location information of GOP unit data, each GOP data can be distinguished by referring to this content location information.
(b)GOP内位置識別情報は、8ビットデータとして、例えば、ビット値を以下の設定とする。
GOPの先頭位置のデータ(StartofGOP)=1
GOPの中間位置のデータ(MiddleofGOP)=2
GOPの末尾位置のデータ(EndofGOP)=3
(B) The position identification information in the GOP is set as the following settings, for example, as 8-bit data.
GOP head position data (StartofGOP) = 1
GOP intermediate position data (MiddleofGOP) = 2
Data at end position of GOP (EndofGOP) = 3
(c)ムービーフラグメントシーケンス番号は、32ビットデータとし、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号を記録する。サブGOPメディアセグメントに格納されたNALユニットの配列情報である。 (C) The movie fragment sequence number is 32-bit data, and the sequence number recorded in the metadata (moof) of the sub GOP media segment before division is recorded. This is arrangement information of NAL units stored in the sub GOP media segment.
(d)NALユニットフラグメントヘッダは、8ビットデータとしテ、メタデータ格納型NALユニットフラグメント対応パケット=1、その他のパケット=0として記録する。 (D) The NAL unit fragment header is recorded as 8-bit data, with metadata storage type NAL unit fragment corresponding packet = 1 and other packets = 0.
(e)NALユニット内位置識別情報は、8ビットデータとして、パケットに格納したNALユニットフラグメント(NALf)が、分割前のNALユニットのどの位置に対応するフラグメントであるかを示す情報を記録する。
分割前のNALユニットの先頭位置(StarNALUnitFragmentSubSegment)=1、
分割前のNALユニットの中間位置(MiddleNALUnitFragmentSubSegment)=2、
分割前のNALユニットの末尾位置(EndNALUnitFragmentSubSegment)=3、
この設定で各ビット値を記録する。
(E) The NAL unit position identification information records, as 8-bit data, information indicating which position of the NAL unit fragment before the division is the NAL unit fragment (NALf) stored in the packet.
Start position of the NAL unit before split (StarNALunitFragmentSubSegment) = 1,
Middle position of NAL unit before division (MiddleNALunitFragmentSubSegment) = 2,
End position of NAL unit before division (EndNALUnitFragmentSubSegment) = 3,
Each bit value is recorded with this setting.
(f)アクセスポイント情報(SAPIndicator)は、HTTPヘッダの記録情報として説明した[X−SAP]と同様のデータであり、8ビットデータとする。パケットが、アクセスポイントを含むNALユニット格納セグメントから生成したパケットである場合は[1]、その他のパケットである場合は[0]を記録する。 (F) The access point information (SAPIndicator) is the same data as [X-SAP] described as the recording information of the HTTP header, and is 8-bit data. If the packet is a packet generated from the NAL unit storage segment including the access point, [1] is recorded, and if it is another packet, [0] is recorded.
図23には、
(1)初期化セグメントHTTPパケット、
(2)メディアセグメントベースのメタデータ格納型NALユニットフラグメント対応HTTPパケット、
(3)メディアセグメントベースのメディアデータ格納型NALユニットフラグメント対応HTTPパケット、
これらの3種類のHTTPパケットの拡張ヘッダに、図22に示す(a)〜(f)の各付加情報を設定した例を示している。
In FIG.
(1) Initialization segment HTTP packet,
(2) Media segment-based metadata storage type NAL unit fragment compatible HTTP packet,
(3) Media segment-based media data storage type NAL unit fragment compatible HTTP packet,
The example which set each additional information of (a)-(f) shown in FIG. 22 to the extension header of these three types of HTTP packets is shown.
送信装置は、このような拡張ヘッダを設定して受信装置に送信する。一方、受信装置は、この拡張ヘッダのセグメント識別情報を参照して、パケットに格納されたセグメントが初期化セグメントを格納したHTTPパケットであるか、メタデータ格納型NALユニットフラグメント対応HTTPパケットであるか、メディアデータ格納型NALユニットフラグメント対応HTTPパケットであるかを判別する。 The transmission device sets such an extension header and transmits it to the reception device. On the other hand, the receiving device refers to the segment identification information in the extension header and determines whether the segment stored in the packet is an HTTP packet storing an initialization segment or an HTTP packet corresponding to a metadata storage type NAL unit fragment It is determined whether the packet is a media data storage type NAL unit fragment compatible HTTP packet.
さらに、受信装置は、パケットがメディアデータ格納型NALユニットフラグメント対応HTTPパケットであると識別した場合、拡張ヘッダのGOP内位置識別情報や、NALユニット内位置識別情報を参照することで、各NALユニットフラグメント(NALf)の再配列、さらにGOPの再構築を行うことが可能となる。 Further, when the receiving apparatus identifies that the packet is a media data storage type NAL unit fragment-compatible HTTP packet, the receiving apparatus refers to each NAL unit by referring to the GOP position identification information in the extension header or the NAL unit position identification information. It becomes possible to rearrange fragments (NALf) and further reconstruct GOP.
さらに、アクセスポイント情報(SAPIndicator)を参照することで、パケットが、アクセスポイントを含むNALユニット格納セグメントから生成したパケットであるか否かを判定することができる。 Furthermore, by referring to the access point information (SAPIndicator), it can be determined whether or not the packet is a packet generated from the NAL unit storage segment including the access point.
[11.LCTヘッダに付加情報を記録した実施例について]
前述したように、マルチキャストやブロードキャスト(MC/BC)型のストリーミングに適用可能なトランスポートプロトコルには、例えばRTP(Real−time Transport Protocol)やFLUTE(File Delivery over Uni−directional Transport)がある。
[11. Example in which additional information is recorded in LCT header]
As described above, transport protocols applicable to multicast and broadcast (MC / BC) type streaming include, for example, RTP (Real-time Transport Protocol) and FLUTE (File Delivery over Uni-directional Transport).
FLUTEプロトコルに従って設定されるパケットには、FLUTEプロトコルに従ったヘッダ情報であるLCTヘッダが設定される。
すなわち、先に図10を参照して説明したIPパケット内のLCTヘッダである。
以下、このLCTヘッダに、NALユニットフラグメント(NALf)の再配列や、GOP再構成処理に適用する情報等、受信装置側における処理をスムーズに実行させるための付加情報を記録した実施例について説明する。
In the packet set according to the FLUTE protocol, an LCT header which is header information according to the FLUTE protocol is set.
That is, the LCT header in the IP packet described above with reference to FIG.
Hereinafter, an embodiment will be described in which additional information for smoothly executing processing on the receiving apparatus side, such as information applied to NAL unit fragment (NALf) rearrangement and GOP reconfiguration processing, is recorded in the LCT header. .
FLUTEプロトコルに従って設定されるLCTヘッダの構成例を図24に示す。
LCTヘッダに設定される主なデータフィールドには、例えば以下のフィールドがある。
CCI(Congestion Control Information):各フィールドの長さや輻輳制御情報等を記録するフィールドである。
TSI(Transport Session Identifier):パケット転送のセッション情報を記録するフィールドである。
TOI(Transport Object Identifier):パケット転送のシーケンス等を記録するフィールドである。
ヘッダ拡張部(Header Extensions):様々な拡張データを記録することができるフィールドである。
A configuration example of the LCT header set in accordance with the FLUTE protocol is shown in FIG.
Examples of main data fields set in the LCT header include the following fields.
CCI (Congestion Control Information): This field records the length of each field, congestion control information, and the like.
TSI (Transport Session Identifier): This field records session information of packet transfer.
TOI (Transport Object Identifier): A field for recording a packet transfer sequence and the like.
Header Extension (Header Extensions): A field in which various extension data can be recorded.
先に、図7を参照して説明したように、GOP内位置情報の代用として、上記のTOIを参照して、データ送信順を確認することが可能である。
前述したように、例えばHTTPヘッダ等に記録する付加情報であるGOP内位置情報について、先頭位置を示すX−StartofGOPのみを記録し、その他のGOP内データの配列順は、LCTヘッダ内のTOIを参照してパケットシーケンスを取得し、パケットシーケンスに従ってGOP内のNALユニットを正しい順に配列する構成としてもよい。
As described above with reference to FIG. 7, the data transmission order can be confirmed with reference to the above TOI as a substitute for the position information in GOP.
As described above, for example, only the X-StartofGOP indicating the head position is recorded in the GOP position information that is additional information recorded in the HTTP header or the like, and the arrangement order of the other GOP data is the TOI in the LCT header. The packet sequence may be acquired by referring to the NAL units in the GOP in the correct order according to the packet sequence.
同様に、NALユニットフラグメント(NALf)の配列情報についても上記のTOIを参照して、データ送信順を確認して再配列を行うことが可能である。例えばHTTPヘッダ等に記録する付加情報であるNALユニット内位置識別情報を、先頭位置のNALユニットフラグメントを格納したパケットのみ、HTTPヘッダに記録する。後続のNALユニットフラグメント配列は、LCTヘッダのTOIからパケットシーケンスを解析して配列することが可能である。 Similarly, the sequence information of NAL unit fragments (NALf) can be rearranged by referring to the above TOI and confirming the data transmission order. For example, in-NAL unit position identification information, which is additional information to be recorded in an HTTP header or the like, is recorded in the HTTP header only for the packet storing the NAL unit fragment at the head position. Subsequent NAL unit fragment sequences can be arranged by analyzing the packet sequence from the TOI of the LCT header.
図24に示すように、LCTヘッダ内には様々なデータを記録できるヘッダ拡張部(Header Extensions)が設定される。このヘッダ拡張部にNALユニットフラグメントの再配列や、GOP再構成処理に適用する情報等、受信装置側における処理をスムーズに実行させるための付加情報を記録することが可能である。 As shown in FIG. 24, a header extension (Header Extensions) capable of recording various data is set in the LCT header. Additional information for smoothly executing processing on the receiving device side, such as rearrangement of NAL unit fragments and information applied to GOP reconfiguration processing, can be recorded in this header extension section.
LCTヘッダのヘッダ拡張部に対するデータ記録構成について、図25を参照して説明する。
LCTヘッダのヘッダ拡張部に、データを記録する場合のフォーマットには2つの種類がある。
図25(1)は、記録情報の長さが自由に設定可能なフォーマットである。
図25(2)は、記録情報の長さが固定されたフォーマットである。
A data recording configuration for the header extension portion of the LCT header will be described with reference to FIG.
There are two types of formats for recording data in the header extension part of the LCT header.
FIG. 25 (1) shows a format in which the length of recording information can be freely set.
FIG. 25 (2) shows a format in which the length of recorded information is fixed.
HET(Header Extension Type)には、拡張ヘッダの種類を示す拡張ヘッダ識別情報(数値)を記録する。図25(1)のフォーマットは127までの値が利用可能であり、図25(2)のフォーマットは128以上に設定することが規定されている。
HET(Header Extension Length)には、拡張ヘッダの長さを記録する。
HEC(Neader Extension Content)は、拡張ヘッダコンテンツを記録するフィールドであり、任意の拡張情報を記録可能なフィールドである。
In HET (Header Extension Type), extension header identification information (numerical value) indicating the type of extension header is recorded. The format of FIG. 25 (1) can use values up to 127, and the format of FIG. 25 (2) is specified to be set to 128 or more.
In HET (Header Extension Length), the length of the extension header is recorded.
The HEC (Neader Extension Content) is a field for recording extension header content, and can record arbitrary extension information.
図25(2)に示す記録情報の長さが固定されたフォーマットを利用して、NALユニットフラグメントの再配列や、GOP再構成処理に適用する情報等、受信装置側における処理をスムーズに実行させるための付加情報を記録する場合の記録データの構成例を図26に示す。 Using the format in which the length of the recording information shown in FIG. 25 (2) is fixed, the processing on the receiving apparatus side such as information to be rearranged in NAL unit fragments and information applied to the GOP reconstruction processing is smoothly executed. FIG. 26 shows a configuration example of recording data when additional information for recording is recorded.
図26に示すように、
(a)拡張ヘッダ識別情報(HET)は、8ビットデータとして、新たな情報の識別値として、例えば[200]を記録する。
さらに、拡張情報記録部(HEC)に、
(b)セグメント識別情報、
(c)GOP内位置識別情報、
(d)ムービーフラグメントシーケンス番号、
(e)NALユニットフラグメントヘッダ、
(f)NALユニット内位置識別情報、
(g)アクセスポイント情報
これらの各識別情報を記録する。
As shown in FIG.
(A) The extension header identification information (HET) records, for example, [200] as the identification value of new information as 8-bit data.
In addition, the extended information recording unit (HEC)
(B) segment identification information,
(C) GOP position identification information,
(D) Movie fragment sequence number,
(E) NAL unit fragment header,
(F) NAL unit position identification information,
(G) Access point information Each of these pieces of identification information is recorded.
例えば(b)セグメント識別情報は、8ビットデータとし、初期化セグメントの場合は1を設定し、その他のセグメントの場合は0を設定する。
なお、メディアセグメントの場合、HTTPヘッダに記録されるコンテンツ位置情報(ContentLocation)をGOP単位データの位置情報に設定すれば、このコンテンツ位置情報を参照することで各GOPデータの区別が可能となる。
For example, (b) segment identification information is 8-bit data, 1 is set for the initialization segment, and 0 is set for the other segments.
In the case of a media segment, if the content location information (ContentLocation) recorded in the HTTP header is set as the location information of GOP unit data, each GOP data can be distinguished by referring to this content location information.
(c)GOP内位置識別情報は、8ビットデータとして、例えば、ビット値を以下の設定とする。
GOPの先頭位置のデータ(StartofGOP)=1
GOPの中間位置のデータ(MiddleofGOP)=2
GOPの末尾位置のデータ(EndofGOP)=3
(C) The position identification information in GOP is set as the following setting, for example, as 8-bit data.
GOP head position data (StartofGOP) = 1
GOP intermediate position data (MiddleofGOP) = 2
Data at end position of GOP (EndofGOP) = 3
(d)ムービーフラグメントシーケンス番号は、32ビットデータとし、分割前のサブGOPメディアセグメントのメタデータ(moof)に記録されたシーケンス番号を記録する。サブGOPメディアセグメントに格納されたNALユニットの配列情報である。 (D) The movie fragment sequence number is 32-bit data, and the sequence number recorded in the metadata (moof) of the sub GOP media segment before division is recorded. This is arrangement information of NAL units stored in the sub GOP media segment.
(e)NALユニットフラグメントヘッダは、8ビットデータとしテ、メタデータ格納型NALユニットフラグメント対応パケット=1、その他のパケット=0として記録する。 (E) The NAL unit fragment header is recorded as 8-bit data, metadata storing type NAL unit fragment corresponding packet = 1, and other packets = 0.
(f)NALユニット内位置識別情報は、8ビットデータとして、パケットに格納したNALユニットフラグメント(NALf)が、分割前のNALユニットのどの位置に対応するフラグメントであるかを示す情報を記録する。
分割前のNALユニットの先頭位置(StarNALUnitFragmentSubSegment)=1、
分割前のNALユニットの中間位置(MiddleNALUnitFragmentSubSegment)=2、
分割前のNALユニットの末尾位置(EndNALUnitFragmentSubSegment)=3、
この設定で各ビット値を記録する。
(F) In the NAL unit position identification information, information indicating which position of the NAL unit before the division the NAL unit fragment (NALf) stored in the packet is recorded as 8-bit data.
Start position of the NAL unit before split (StarNALunitFragmentSubSegment) = 1,
Middle position of NAL unit before division (MiddleNALunitFragmentSubSegment) = 2,
End position of NAL unit before division (EndNALUnitFragmentSubSegment) = 3,
Each bit value is recorded with this setting.
(g)アクセスポイント情報(SAPIndicator)は、HTTPヘッダの記録情報として説明した[X−SAP]と同様のデータであり、8ビットデータとする。パケットが、アクセスポイントを含むNALユニット格納セグメントから生成したパケットである場合は[1]、その他のパケットである場合は[0]を記録する。 (G) The access point information (SAPIndicator) is the same data as [X-SAP] described as the recording information of the HTTP header, and is 8-bit data. If the packet is a packet generated from the NAL unit storage segment including the access point, [1] is recorded, and if it is another packet, [0] is recorded.
送信装置は、このような拡張ヘッダ情報を含むLCTヘッダを設定して受信装置に送信する。一方、受信装置は、このLCTヘッダ内の拡張ヘッダ情報のセグメント識別情報を参照して、初期化セグメント格納パケットであるか、メタデータ格納型NALユニットフラグメント対応パケットであるか、メディアデータ格納型NALユニットフラグメント対応パケットであるかを判別する。さらに、受信装置は、パケットがメディアデータ格納型NALユニットフラグメント対応パケットであると識別した場合、LCTヘッダの拡張ヘッダ情報に記録されたNALユニット内位置識別情報や、GOP内位置識別情報を参照することで、各パケットに格納されたメディアデータ(mdat)であるNALユニットフラグメント(NALf)を正しい配列とする再配列を行い、さらにGOPの再構成を行うことが可能となる。 The transmission apparatus sets the LCT header including such extension header information and transmits it to the reception apparatus. On the other hand, the receiving device refers to the segment identification information of the extension header information in the LCT header, determines whether it is an initialization segment storage packet, a metadata storage type NAL unit fragment correspondence packet, or a media data storage type NAL. It is determined whether the packet is a unit fragment compatible packet. Further, when the receiving apparatus identifies that the packet is a media data storage type NAL unit fragment compatible packet, the receiving apparatus refers to the NAL unit position identification information or the GOP position identification information recorded in the extended header information of the LCT header. As a result, the NAL unit fragment (NALf), which is the media data (mdat) stored in each packet, is rearranged so as to be correctly arranged, and the GOP can be reconfigured.
さらに、アクセスポイント情報(SAPIndicator)を参照することで、パケットが、アクセスポイントを含むNALユニット格納セグメントから生成したパケットであるか否かを判定することができる。 Furthermore, by referring to the access point information (SAPIndicator), it can be determined whether or not the packet is a packet generated from the NAL unit storage segment including the access point.
[12.HEVC符号化データに対する適用例について]
上述した実施例では、MPEG符号化方式に従ったMP4符号化データに対する処理例について説明したが、本開示の処理は、その他の符号化データに足しても適用可能である。例えばHEVC(High Efficiency Video Coding)に従った符号化データに適用することが可能である。
[12. Application example for HEVC encoded data]
In the above-described embodiment, the processing example for the MP4 encoded data according to the MPEG encoding method has been described. However, the process of the present disclosure can be applied to other encoded data. For example, the present invention can be applied to encoded data according to HEVC (High Efficiency Video Coding).
HEVC符号化データの構成について、図27を参照して説明する。
図27に示すように、HEVC符号化処理によって生成される1つのHEVCストリームは、複数のシーケンス(CVS:Coded Video Sequence)と、End of sequence NAL unit(EoB)を有する。
The configuration of HEVC encoded data will be described with reference to FIG.
As shown in FIG. 27, one HEVC stream generated by the HEVC encoding process has a plurality of sequences (CVS: Coded Video Sequence) and an End of sequence NAL unit (EoB).
HEVCストリームの構成要素であるCVSは、複数のGOPと、End of sequence NAL unit(EoS)から構成される。
1つのGOPは、ランダムアクセスポイントとなるIRAP(Intra Random Access Point)アクセスユニットを先頭データとし、複数のLP(Leading Picture)アクセスユニットと、TP(Trailing Picture)アクセスユニットを有する。
The CVS, which is a component of the HEVC stream, includes a plurality of GOPs and an end of sequence NAL unit (EoS).
One GOP has an IRAP (Intra Random Access Point) access unit serving as a random access point as head data, and has a plurality of LP (Leading Picture) access units and a TP (Trailing Picture) access unit.
LPアクセスユニットと、TPアクセスユニットは、何らかの参照ピクチャを参照して復号可能なアクセスユニットである。
ただし、IRAPアクセスユニットから復号を開始した場合には、TPAUについても正常な復号、再生が可能である。
The LP access unit and the TP access unit are access units that can be decoded with reference to some reference picture.
However, when decoding is started from the IRAP access unit, normal decoding and reproduction can also be performed for TPAU.
アクセスユニット(AU)は、複数のNALユニット(Network Abstraction Layer Unit)から構成され、アクセスユニット(AU)は、必ず1つ以上のスライスセグメントNALユニットを含む。 The access unit (AU) is composed of a plurality of NAL units (Network Abstraction Layer Units), and the access unit (AU) always includes one or more slice segment NAL units.
図27に示すように、HEVC符号化処理によって生成される符号化データにも符号化処理単位としてのGOPが設定され、このGOPは、さらに複数のNALユニットに分割される。
先に図5を参照して説明したサブGOPメディアセグメントに、HEVC符号化データにおいて設定されるGOP構成データであるNALユニットを1つ、または複数、格納する構成とする。
As shown in FIG. 27, a GOP as an encoding processing unit is also set in encoded data generated by HEVC encoding processing, and this GOP is further divided into a plurality of NAL units.
One or a plurality of NAL units, which are GOP configuration data set in HEVC encoded data, are stored in the sub GOP media segment described above with reference to FIG.
さらに、先に図16他を参照して説明したようにNALユニットをさらに分割したNALユニットフラグメント(NALf)を生成して、HTTPパケットに分割格納することが可能である。 Furthermore, as described above with reference to FIG. 16 and others, it is possible to generate a NAL unit fragment (NALf) obtained by further dividing a NAL unit and store it in an HTTP packet.
このように、HEVC符号化データについても、GOPデータの分割データであるNALユニットをさらに分割したNALユニットフラグメント(NALf)が生成可能である。従って、図16他を参照して説明した処理が可能であり、本開示の処理を適用することができる。
なお、MP4、HEVCに限らず、GOP相当の符号化処理単位を持ち、GOPデータを分割したユニット(NAL)が設定される符号化構成であれば、本開示の処理を適用することが可能である。
As described above, a NAL unit fragment (NALf) obtained by further dividing a NAL unit that is divided data of GOP data can also be generated for HEVC encoded data. Accordingly, the processing described with reference to FIG. 16 and the like is possible, and the processing of the present disclosure can be applied.
It should be noted that the present disclosure is not limited to MP4 and HEVC, as long as the encoding configuration has an encoding processing unit equivalent to GOP and a unit (NAL) in which GOP data is divided is set. is there.
[13.各装置のハードウェア構成例について]
最後に、図28を参照して、上述した処理を実行する各装置のハードウェア構成例について説明する。
図28は、送信装置20、受信装置30として適用可能な通信装置のハードウェア構成例を示している。
[13. About hardware configuration example of each device]
Finally, with reference to FIG. 28, a hardware configuration example of each device that executes the above-described processing will be described.
FIG. 28 illustrates a hardware configuration example of a communication device applicable as the
CPU(Central Processing Unit)201は、ROM(Read Only Memory)202、または記憶部208に記憶されているプログラムに従って各種の処理を実行するデータ処理部として機能する。例えば、上述した実施例において説明したシーケンスに従った処理を実行する。RAM(Random Access Memory)203には、CPU201が実行するプログラムやデータなどが記憶される。これらのCPU201、ROM202、およびRAM203は、バス204により相互に接続されている。
A CPU (Central Processing Unit) 201 functions as a data processing unit that executes various processes according to a program stored in a ROM (Read Only Memory) 202 or a
CPU201はバス204を介して入出力インタフェース205に接続され、入出力インタフェース205には、各種スイッチ、キーボード、マウス、マイクロホンなどよりなる入力部206、ディスプレイ、スピーカなどよりなる出力部207が接続されている。CPU201は、入力部206から入力される指令に対応して各種の処理を実行し、処理結果を例えば出力部207に出力する。
The
入出力インタフェース205に接続されている記憶部208は、例えばハードディスク等からなり、CPU201が実行するプログラムや各種のデータを記憶する。通信部209は、インターネットやローカルエリアネットワークなどのネットワークを介したデータ通信の送受信部、さらに放送波の送受信部として機能し、外部の装置と通信する。
A
入出力インタフェース205に接続されているドライブ210は、磁気ディスク、光ディスク、光磁気ディスク、あるいはメモリカード等の半導体メモリなどのリムーバブルメディア211を駆動し、データの記録あるいは読み取りを実行する。
A
なお、データの符号化あるいは復号は、データ処理部としてのCPU201の処理として実行可能であるが、符号化処理あるいは復号処理を実行するための専用ハードウェアとしてのコーデックを備えた構成としてもよい。
Data encoding or decoding can be executed as processing of the
[14.本開示の構成のまとめ]
以上、特定の実施例を参照しながら、本開示の実施例について詳解してきた。しかしながら、本開示の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本開示の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。
[14. Summary of composition of the present disclosure]
As described above, the embodiments of the present disclosure have been described in detail with reference to specific embodiments. However, it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present disclosure. In other words, the present invention has been disclosed in the form of exemplification, and should not be interpreted in a limited manner. In order to determine the gist of the present disclosure, the claims should be taken into consideration.
なお、本明細書において開示した技術は、以下のような構成をとることができる。
(1) 符号化データを格納したパケットを生成するデータ処理部と、
前記データ処理部の生成したパケットを送信する通信部を有し、
前記データ処理部は、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットを生成し、
パケットに対する付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報を設定したパケットを生成して前記通信部を介して送信する通信装置。
The technology disclosed in this specification can take the following configurations.
(1) a data processing unit for generating a packet storing encoded data;
A communication unit that transmits the packet generated by the data processing unit;
The data processing unit
Generate a packet that stores a NAL unit that constitutes a GOP (Group of Pictures), which is a processing unit of encoded data, or a NAL unit fragment obtained by further dividing the NAL unit,
As the additional information for the packet, the communication is performed by generating a packet in which access point information indicating whether the NAL unit stored in the packet or the NAL unit that is the division source of the NAL unit fragment includes data to be a random access point is set. A communication device for transmitting via a unit.
(2)前記アクセスポイント情報は、パケット格納データが、SAP(Streeming Access Point)によって指定される符号化データを含むNALユニットに基づいて生成されたデータであるか否かを示す情報である前記(1)に記載の通信装置。 (2) The access point information is information indicating whether the packet storage data is data generated based on a NAL unit including encoded data specified by SAP (Streaming Access Point). The communication device according to 1).
(3)前記データ処理部は、GOPの構成データであるNALユニットを1つ以上含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成する前記(1)または(2)に記載の通信装置。 (3) The data processing unit generates, as packet storage data, media data including one or more NAL units that are GOP configuration data and a sub-GOP media segment storing metadata corresponding to the media data. ) Or (2).
(4)前記データ処理部は、GOPを構成するNALユニットをさらに分割したNALユニットフラグメントを生成して、NALユニットフラグメントを格納した複数のパケットと、前記NALユニットに対応するメタデータを格納したパケットを生成する前記(1)または(2)に記載の通信装置。 (4) The data processing unit generates a NAL unit fragment obtained by further dividing the NAL unit constituting the GOP, and stores a plurality of packets storing the NAL unit fragment and metadata corresponding to the NAL unit. The communication device according to (1) or (2).
(5)前記データ処理部は、送信対象の符号化データを、通信経路上で規定される最大データ転送単位(MTU:Maximum Transfer Unit)以下のデータに分割して生成した分割データを格納したパケットを生成する前記(1)〜(4)いずれかに記載の通信装置。 (5) The data processing unit stores the divided data generated by dividing the encoded data to be transmitted into data equal to or less than the maximum data transfer unit (MTU) specified on the communication path. The communication device according to any one of (1) to (4).
(6)前記データ処理部は、HTTPパケットを生成し、前記付加情報を生成パケット内のHTTPヘッダに記録する前記(1)〜(5)いずれかに記載の通信装置。 (6) The communication device according to any one of (1) to (5), wherein the data processing unit generates an HTTP packet and records the additional information in an HTTP header in the generated packet.
(7)前記データ処理部は、前記付加情報を生成パケット内の拡張ヘッダに記録する前記(1)〜(5)いずれかに記載の通信装置。 (7) The communication device according to any one of (1) to (5), wherein the data processing unit records the additional information in an extension header in a generated packet.
(8)前記データ処理部は、前記付加情報を生成パケット内のLCTヘッダに記録する前記(1)〜(5)いずれかに記載の通信装置。 (8) The communication device according to any one of (1) to (5), wherein the data processing unit records the additional information in an LCT header in a generated packet.
(9)前記通信部は、前記データ処理部の生成したパケットを、放送波を介してブロードキャスト配信、またはマルチキャスト配信する前記(1)〜(8)いずれかに記載の通信装置。 (9) The communication device according to any one of (1) to (8), wherein the communication unit performs broadcast distribution or multicast distribution of the packet generated by the data processing unit via a broadcast wave.
(10)送信装置が送信した符号化データ格納パケットを受信する通信部と、
前記通信部の受信したパケットを入力して処理を実行するデータ処理部を有し、
前記通信部の受信する前記符号化データ格納パケットの各々は、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットであり、付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報が設定されたパケットである通信装置。
(10) a communication unit that receives the encoded data storage packet transmitted by the transmission device;
A data processing unit that inputs a packet received by the communication unit and executes processing;
Each of the encoded data storage packets received by the communication unit is:
A packet that stores a NAL unit that constitutes a GOP (Group of Pictures) that is a processing unit of encoded data, or a NAL unit fragment that is a further division of the NAL unit. As additional information, the NAL unit or NAL stored in the packet A communication apparatus which is a packet in which access point information indicating whether or not a NAL unit which is a unit fragment division source includes data to be a random access point is set.
(11)前記データ処理部は、
受信パケットに記録された付加情報である前記アクセスポイント情報を参照して、受信パケットに格納されたデータが、SAP(Streeming Access Point)によって指定される符号化データを含むNALユニットに基づいて生成されたデータであるか否かを判定する処理を実行する前記(10)に記載の通信装置。
(11) The data processing unit
With reference to the access point information, which is additional information recorded in the received packet, the data stored in the received packet is generated based on a NAL unit including encoded data specified by SAP (Streaming Access Point). The communication device according to (10), wherein a process for determining whether or not the received data is determined.
(12)前記データ処理部は、受信パケットに記録された付加情報である前記アクセスポイント情報を参照して、アクセスポイントを含むデータを選択取得して、復号、再生処理を実行する前記(10)または(11)に記載の通信装置。 (12) The data processing unit refers to the access point information that is additional information recorded in the received packet, selects and acquires data including the access point, and executes decoding and reproduction processing (10) Or the communication apparatus as described in (11).
(13)前記通信部は、前記付加情報をHTTPヘッダに記録したHTTPパケットを受信し、前記データ処理部は、受信パケットのHTTPヘッダから前記付加情報を取得する前記(10)〜(12)いずれかに記載の通信装置。
(13) The communication unit receives an HTTP packet in which the additional information is recorded in an HTTP header, and the data processing unit acquires the additional information from the HTTP header of the received packet. A communication device according to
(14)前記通信部は、前記付加情報を拡張ヘッダに記録したパケットを受信し、
前記データ処理部は、受信パケットの拡張ヘッダから前記付加情報を取得する前記(10)〜(12)いずれかに記載の通信装置。
(14) The communication unit receives a packet in which the additional information is recorded in an extension header,
The communication device according to any one of (10) to (12), wherein the data processing unit acquires the additional information from an extension header of a received packet.
(15)前記通信部は、前記付加情報をLCTヘッダに記録したパケットを受信し、前記データ処理部は、受信パケットのLCTヘッダから前記付加情報を取得する前記(10)〜(12)いずれかに記載の通信装置。 (15) The communication unit receives a packet in which the additional information is recorded in an LCT header, and the data processing unit acquires the additional information from the LCT header of the received packet. The communication apparatus as described in.
(16)前記通信部は、前記パケットを、放送波を介して受信する前記(10)〜(15)いずれかに記載の通信装置。 (16) The communication device according to any one of (10) to (15), wherein the communication unit receives the packet via a broadcast wave.
(17)データ送信装置において実行する通信データ生成方法であり、
データ処理部が、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットを生成し、
パケットに対する付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報を設定したパケットを生成して通信部を介して送信する通信データ生成方法。
(17) A communication data generation method executed in a data transmission device,
The data processor
Generate a packet that stores a NAL unit that constitutes a GOP (Group of Pictures), which is a processing unit of encoded data, or a NAL unit fragment obtained by further dividing the NAL unit,
As a supplementary information for the packet, a communication unit is generated by generating a packet in which access point information indicating whether or not the NAL unit stored in the packet or the NAL unit that is the division source of the NAL unit fragment includes data serving as a random access point is set. A method for generating communication data to be transmitted via the Internet.
(18)データ受信装置において実行する通信データ処理方法であり、
通信部が、送信装置が送信した符号化データ格納パケットを受信するステップと、
データ処理部が、前記通信部の受信したパケットを入力して処理を実行するデータ処理ステップを実行し、
前記通信部の受信する前記符号化データ格納パケットの各々は、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットであり、付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報が設定されたパケットであり、
前記データ処理ステップは、前記通信部の受信したアクセスポイント情報が設定されたパケットを入力して処理を実行するステップである通信データ処理方法。
(18) A communication data processing method executed in the data receiving device,
A communication unit receiving an encoded data storage packet transmitted by a transmission device;
A data processing unit executes a data processing step of inputting a packet received by the communication unit and executing a process,
Each of the encoded data storage packets received by the communication unit is:
A packet that stores a NAL unit that constitutes a GOP (Group of Pictures) that is a processing unit of encoded data, or a NAL unit fragment that is a further division of the NAL unit. As additional information, the NAL unit or NAL stored in the packet A packet in which access point information indicating whether or not the NAL unit that is the source of the unit fragment includes data to be a random access point is set,
The data processing step is a communication data processing method which is a step of executing processing by inputting a packet in which access point information received by the communication unit is set.
また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、LAN(Local Area Network)、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。 The series of processing described in the specification can be executed by hardware, software, or a combined configuration of both. When executing processing by software, the program recording the processing sequence is installed in a memory in a computer incorporated in dedicated hardware and executed, or the program is executed on a general-purpose computer capable of executing various processing. It can be installed and run. For example, the program can be recorded in advance on a recording medium. In addition to being installed on a computer from a recording medium, the program can be received via a network such as a LAN (Local Area Network) or the Internet and can be installed on a recording medium such as a built-in hard disk.
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 Note that the various processes described in the specification are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Further, in this specification, the system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to being in the same casing.
以上、説明したように、本開示の一実施例の構成によれば、通信パケットの格納符号化データが、ランダムアクセス可能な符号化データに基づくデータであるか否かをパケット単位で判別可能とした構成が実現される。
具体的には、送信装置が、符号化データの構成要素であるNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットを生成し、付加情報として、パケット格納データの元データであるNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報を設定して送信する。受信装置はパケット付加情報を参照してパケット格納データが、ランダムアクセス可能な符号化データに基づいて生成されたデータであるか否かを判別する。
本構成により、通信パケットの格納符号化データが、ランダムアクセス可能な符号化データに基づくデータであるか否かをパケット単位で判別可能とした構成が実現される。
As described above, according to the configuration of an embodiment of the present disclosure, it is possible to determine in units of packets whether the stored encoded data of a communication packet is data based on encoded data that can be accessed randomly. This configuration is realized.
Specifically, the transmission device generates a packet storing a NAL unit that is a component of encoded data or a NAL unit fragment obtained by further dividing the NAL unit, and is the original data of the packet storage data as additional information Access point information indicating whether or not the NAL unit includes data to be a random access point is set and transmitted. The receiving apparatus refers to the packet additional information to determine whether or not the packet storage data is data generated based on randomly accessible encoded data.
With this configuration, it is possible to realize a configuration in which it is possible to determine whether or not the stored encoded data of the communication packet is data based on randomly accessible encoded data for each packet.
10 通信システム
20 送信装置
21 データ処理部
22 通信部
30 受信装置
31 データ処理部
32 通信部
50 初期化セグメント
60 メディアセグメント
201 CPU
202 ROM
203 RAM
204 バス
205 入出力インタフェース
206 入力部
207 出力部
208 記憶部
209 通信部
210 ドライブ
211 リムーバブルメディア
DESCRIPTION OF SYMBOLS 10
202 ROM
203 RAM
Claims (18)
前記データ処理部の生成したパケットを送信する通信部を有し、
前記データ処理部は、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットを生成し、
パケットに対する付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報を設定したパケットを生成して前記通信部を介して送信する通信装置。 A data processing unit for generating a packet storing encoded data;
A communication unit that transmits the packet generated by the data processing unit;
The data processing unit
Generate a packet that stores a NAL unit that constitutes a GOP (Group of Pictures), which is a processing unit of encoded data, or a NAL unit fragment obtained by further dividing the NAL unit,
As the additional information for the packet, the communication is performed by generating a packet in which access point information indicating whether the NAL unit stored in the packet or the NAL unit that is the division source of the NAL unit fragment includes data to be a random access point is set. A communication device for transmitting via a unit.
GOPの構成データであるNALユニットを1つ以上含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成する請求項1に記載の通信装置。 The data processing unit
The communication apparatus according to claim 1, wherein a sub GOP media segment storing media data including one or more NAL units as GOP configuration data and metadata corresponding to the media data is generated as packet storage data.
GOPを構成するNALユニットをさらに分割したNALユニットフラグメントを生成して、NALユニットフラグメントを格納した複数のパケットと、前記NALユニットに対応するメタデータを格納したパケットを生成する請求項1に記載の通信装置。 The data processing unit
The NAL unit fragment which further divided | segmented the NAL unit which comprises GOP is produced | generated, The packet which stored the several packet which stored the NAL unit fragment, and the metadata corresponding to the said NAL unit is produced | generated. Communication device.
送信対象の符号化データを、通信経路上で規定される最大データ転送単位(MTU:Maximum Transfer Unit)以下のデータに分割して生成した分割データを格納したパケットを生成する請求項1に記載の通信装置。 The data processing unit
2. The packet according to claim 1, wherein the encoded data to be transmitted is divided into data equal to or less than a maximum data transfer unit (MTU) defined on the communication path, and a packet storing the divided data is generated. Communication device.
HTTPパケットを生成し、前記付加情報を生成パケット内のHTTPヘッダに記録する請求項1に記載の通信装置。 The data processing unit
The communication apparatus according to claim 1, wherein an HTTP packet is generated, and the additional information is recorded in an HTTP header in the generated packet.
前記付加情報を生成パケット内の拡張ヘッダに記録する請求項1に記載の通信装置。 The data processing unit
The communication apparatus according to claim 1, wherein the additional information is recorded in an extension header in the generated packet.
前記付加情報を生成パケット内のLCTヘッダに記録する請求項1に記載の通信装置。 The data processing unit
The communication apparatus according to claim 1, wherein the additional information is recorded in an LCT header in a generated packet.
前記データ処理部の生成したパケットを、放送波を介してブロードキャスト配信、またはマルチキャスト配信する請求項1に記載の通信装置。 The communication unit is
The communication apparatus according to claim 1, wherein the packet generated by the data processing unit is broadcast or multicast via a broadcast wave.
前記通信部の受信したパケットを入力して処理を実行するデータ処理部を有し、
前記通信部の受信する前記符号化データ格納パケットの各々は、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットであり、付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報が設定されたパケットである通信装置。 A communication unit that receives the encoded data storage packet transmitted by the transmission device; and
A data processing unit that inputs a packet received by the communication unit and executes processing;
Each of the encoded data storage packets received by the communication unit is:
A packet that stores a NAL unit that constitutes a GOP (Group of Pictures) that is a processing unit of encoded data, or a NAL unit fragment that is a further division of the NAL unit. As additional information, the NAL unit or NAL stored in the packet A communication apparatus which is a packet in which access point information indicating whether or not a NAL unit which is a unit fragment division source includes data to be a random access point is set.
受信パケットに記録された付加情報である前記アクセスポイント情報を参照して、受信パケットに格納されたデータが、SAP(Streeming Access Point)によって指定される符号化データを含むNALユニットに基づいて生成されたデータであるか否かを判定する処理を実行する請求項10に記載の通信装置。 The data processing unit
With reference to the access point information, which is additional information recorded in the received packet, the data stored in the received packet is generated based on a NAL unit including encoded data specified by SAP (Streaming Access Point). The communication apparatus according to claim 10, wherein a process for determining whether or not the received data is data is executed.
受信パケットに記録された付加情報である前記アクセスポイント情報を参照して、アクセスポイントを含むデータを選択取得して、復号、再生処理を実行する請求項10に記載の通信装置。 The data processing unit
The communication apparatus according to claim 10, wherein the access point information, which is additional information recorded in a received packet, is referred to, data including an access point is selectively acquired, and decoding and reproduction processing are executed.
前記付加情報をHTTPヘッダに記録したHTTPパケットを受信し、
前記データ処理部は、
受信パケットのHTTPヘッダから前記付加情報を取得する請求項10に記載の通信装置。 The communication unit is
Receiving an HTTP packet in which the additional information is recorded in an HTTP header;
The data processing unit
The communication apparatus according to claim 10, wherein the additional information is acquired from an HTTP header of a received packet.
前記付加情報を拡張ヘッダに記録したパケットを受信し、
前記データ処理部は、
受信パケットの拡張ヘッダから前記付加情報を取得する請求項10に記載の通信装置。 The communication unit is
Receiving a packet in which the additional information is recorded in an extension header;
The data processing unit
The communication apparatus according to claim 10, wherein the additional information is acquired from an extension header of a received packet.
前記付加情報をLCTヘッダに記録したパケットを受信し、
前記データ処理部は、
受信パケットのLCTヘッダから前記付加情報を取得する請求項10に記載の通信装置。 The communication unit is
Receiving a packet in which the additional information is recorded in the LCT header;
The data processing unit
The communication apparatus according to claim 10, wherein the additional information is acquired from an LCT header of a received packet.
前記パケットを、放送波を介して受信する請求項10に記載の通信装置。 The communication unit is
The communication device according to claim 10, wherein the packet is received via a broadcast wave.
データ処理部が、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットを生成し、
パケットに対する付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報を設定したパケットを生成して通信部を介して送信する通信データ生成方法。 A communication data generation method executed in a data transmission device,
The data processor
Generate a packet that stores a NAL unit that constitutes a GOP (Group of Pictures), which is a processing unit of encoded data, or a NAL unit fragment obtained by further dividing the NAL unit,
As a supplementary information for the packet, a communication unit is generated by generating a packet in which access point information indicating whether or not the NAL unit stored in the packet or the NAL unit that is the division source of the NAL unit fragment includes data serving as a random access point is set. A method for generating communication data to be transmitted via the Internet.
通信部が、送信装置が送信した符号化データ格納パケットを受信するステップと、
データ処理部が、前記通信部の受信したパケットを入力して処理を実行するデータ処理ステップを実行し、
前記通信部の受信する前記符号化データ格納パケットの各々は、
符号化データの処理単位であるGOP(Group of Pictures)を構成するNALユニット、またはNALユニットをさらに分割したNALユニットフラグメントを格納したパケットであり、付加情報として、パケットに格納したNALユニット、またはNALユニットフラグメントの分割元のNALユニットがランダムアクセスポイントとなるデータを含むか否かを示すアクセスポイント情報が設定されたパケットであり、
前記データ処理ステップは、前記通信部の受信したアクセスポイント情報が設定されたパケットを入力して処理を実行するステップである通信データ処理方法。 A communication data processing method executed in a data receiving device,
A communication unit receiving an encoded data storage packet transmitted by a transmission device;
A data processing unit executes a data processing step of inputting a packet received by the communication unit and executing a process,
Each of the encoded data storage packets received by the communication unit is:
A packet that stores a NAL unit that constitutes a GOP (Group of Pictures) that is a processing unit of encoded data, or a NAL unit fragment that is a further division of the NAL unit. As additional information, the NAL unit or NAL stored in the packet A packet in which access point information indicating whether or not the NAL unit that is the source of the unit fragment includes data to be a random access point is set,
The data processing step is a communication data processing method which is a step of executing processing by inputting a packet in which access point information received by the communication unit is set.
Priority Applications (11)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014006881A JP2015136059A (en) | 2014-01-17 | 2014-01-17 | Communication device, communication data generation method, and communication data processing method |
| CN201480072676.XA CN105900446B (en) | 2014-01-17 | 2014-12-01 | Communication device, communication data generation method and processing method of communication data |
| US15/110,197 US10178417B2 (en) | 2014-01-17 | 2014-12-01 | Communication apparatus, communication data generation method, and communication data processing method |
| KR1020167018108A KR102103054B1 (en) | 2014-01-17 | 2014-12-01 | Communication apparatus, communication data generation method, and communication data processing method |
| CA2936164A CA2936164C (en) | 2014-01-17 | 2014-12-01 | Communication apparatus, communication data generation method, and communication data processing method |
| PCT/JP2014/081715 WO2015107786A1 (en) | 2014-01-17 | 2014-12-01 | Communication apparatus, communication data generation method, and communication data processing method |
| EP14878795.5A EP3096533B1 (en) | 2014-01-17 | 2014-12-01 | Communication apparatus, communication data generation method, and communication data processing method |
| MX2016008985A MX384785B (en) | 2014-01-17 | 2014-12-01 | COMMUNICATION APPARATUS, COMMUNICATION DATA GENERATING METHOD, AND COMMUNICATION DATA PROCESSING METHOD. |
| MX2019009888A MX2019009888A (en) | 2014-01-17 | 2016-07-08 | Communication apparatus, communication data generation method, and communication data processing method. |
| US16/179,444 US10820024B2 (en) | 2014-01-17 | 2018-11-02 | Communication apparatus, communication data generation method, and communication data processing method |
| US17/034,591 US11284135B2 (en) | 2014-01-17 | 2020-09-28 | Communication apparatus, communication data generation method, and communication data processing method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014006881A JP2015136059A (en) | 2014-01-17 | 2014-01-17 | Communication device, communication data generation method, and communication data processing method |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2015136059A true JP2015136059A (en) | 2015-07-27 |
Family
ID=53542690
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2014006881A Pending JP2015136059A (en) | 2014-01-17 | 2014-01-17 | Communication device, communication data generation method, and communication data processing method |
Country Status (8)
| Country | Link |
|---|---|
| US (3) | US10178417B2 (en) |
| EP (1) | EP3096533B1 (en) |
| JP (1) | JP2015136059A (en) |
| KR (1) | KR102103054B1 (en) |
| CN (1) | CN105900446B (en) |
| CA (1) | CA2936164C (en) |
| MX (2) | MX384785B (en) |
| WO (1) | WO2015107786A1 (en) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3036883B3 (en) * | 2014-02-24 | 2021-11-24 | LG Electronics Inc. | Apparatus for transmitting broadcast signals and method for transmitting broadcast signals |
| CN107533846B (en) | 2015-04-24 | 2022-09-16 | 索尼公司 | Transmission device, transmission method, reception device, and reception method |
| US10079919B2 (en) * | 2016-05-27 | 2018-09-18 | Solarflare Communications, Inc. | Method, apparatus and computer program product for processing data |
| US10116970B1 (en) * | 2017-04-28 | 2018-10-30 | Empire Technology Development Llc | Video distribution, storage, and streaming over time-varying channels |
| US10862940B1 (en) * | 2018-07-31 | 2020-12-08 | Glance Networks, Inc. | Low latency live video on a communication session |
| CN111641565B (en) * | 2019-03-01 | 2022-05-13 | 华为技术有限公司 | Method, device and system for transmitting Ethernet message |
| CN113365140B (en) | 2021-06-21 | 2022-12-23 | 北京百度网讯科技有限公司 | MP4 online playing method, device, equipment, storage medium and program product |
Family Cites Families (31)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5963202A (en) * | 1997-04-14 | 1999-10-05 | Instant Video Technologies, Inc. | System and method for distributing and managing digital video information in a video distribution network |
| US6882637B1 (en) | 1999-10-14 | 2005-04-19 | Nokia Networks Oy | Method and system for transmitting and receiving packets |
| US6792449B2 (en) | 2001-06-28 | 2004-09-14 | Microsoft Corporation | Startup methods and apparatuses for use in streaming content |
| US20030048808A1 (en) * | 2001-09-12 | 2003-03-13 | Stahl Thomas Anthony | Method and apparatus for changing received streaming content channels |
| EP1349285A1 (en) | 2002-03-28 | 2003-10-01 | Matsushita Electric Industrial Co., Ltd. | Method for making efficient use of the bits allocated to the sequence number when transmitting compressed header data |
| US8683535B2 (en) | 2004-03-26 | 2014-03-25 | Broadcom Corporation | Fast channel change |
| US8670437B2 (en) * | 2005-09-27 | 2014-03-11 | Qualcomm Incorporated | Methods and apparatus for service acquisition |
| CN101371312B (en) * | 2005-12-08 | 2015-12-02 | 维德约股份有限公司 | Systems and methods for error resilience and random access in a video communication system |
| US9432433B2 (en) * | 2006-06-09 | 2016-08-30 | Qualcomm Incorporated | Enhanced block-request streaming system using signaling or block creation |
| EP2304955B1 (en) * | 2008-07-26 | 2017-03-29 | Thomson Licensing | A real-time transport protocol (rtp) packetization method for fast channel change applications using scalable video coding (svc) |
| JP2010245970A (en) * | 2009-04-08 | 2010-10-28 | Sony Corp | REPRODUCTION DEVICE, REPRODUCTION METHOD, AND PROGRAM |
| US20110031771A1 (en) | 2009-08-10 | 2011-02-10 | Yi Ding | Storage trunk in the front of a vehicle |
| JP2011087103A (en) | 2009-10-15 | 2011-04-28 | Sony Corp | Provision of content reproduction system, content reproduction device, program, content reproduction method, and content server |
| US9049497B2 (en) * | 2010-06-29 | 2015-06-02 | Qualcomm Incorporated | Signaling random access points for streaming video data |
| WO2012099529A1 (en) | 2011-01-19 | 2012-07-26 | Telefonaktiebolaget L M Ericsson (Publ) | Indicating bit stream subsets |
| US9215473B2 (en) | 2011-01-26 | 2015-12-15 | Qualcomm Incorporated | Sub-slices in video coding |
| KR101803970B1 (en) * | 2011-03-16 | 2017-12-28 | 삼성전자주식회사 | Method and apparatus for composing content |
| US9357275B2 (en) * | 2011-09-06 | 2016-05-31 | Qualcomm Incorporated | Network streaming of coded video data |
| US9843844B2 (en) | 2011-10-05 | 2017-12-12 | Qualcomm Incorporated | Network streaming of media data |
| WO2013077670A1 (en) | 2011-11-23 | 2013-05-30 | 한국전자통신연구원 | Method and apparatus for streaming service for providing scalability and view information |
| CN102625125A (en) * | 2012-03-15 | 2012-08-01 | 天津大学 | A method for real-time transmission of high-resolution multi-viewpoint stereoscopic video |
| WO2013162292A1 (en) * | 2012-04-24 | 2013-10-31 | 한국전자통신연구원 | Method and apparatus for transmitting mmt packet for network-adaptive multi-layer video transmission |
| KR101984181B1 (en) * | 2012-06-12 | 2019-05-30 | 엘지전자 주식회사 | Image decoding method and apparatus using same |
| JP5885604B2 (en) | 2012-07-06 | 2016-03-15 | 株式会社Nttドコモ | Moving picture predictive coding apparatus, moving picture predictive coding method, moving picture predictive coding program, moving picture predictive decoding apparatus, moving picture predictive decoding method, and moving picture predictive decoding program |
| US9161039B2 (en) * | 2012-09-24 | 2015-10-13 | Qualcomm Incorporated | Bitstream properties in video coding |
| US20140092995A1 (en) * | 2012-09-28 | 2014-04-03 | Sharp Laboratories Of America, Inc. | Electronic devices for signaling a random access point picture message |
| US9525883B2 (en) * | 2013-07-15 | 2016-12-20 | Qualcomm Incorporated | Cross-layer alignment of intra random access point pictures |
| JP6652320B2 (en) * | 2013-12-16 | 2020-02-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Transmission method, reception method, transmission device, and reception device |
| US9699229B2 (en) * | 2014-01-16 | 2017-07-04 | Qualcomm Incorporated | Robust live operation of dash |
| JP2015136060A (en) * | 2014-01-17 | 2015-07-27 | ソニー株式会社 | Communication device, communication data generation method, and communication data processing method |
| US9936233B2 (en) * | 2014-07-31 | 2018-04-03 | Lg Electronics Inc. | Apparatus and method for transmitting/receiving processes of a broadcast signal |
-
2014
- 2014-01-17 JP JP2014006881A patent/JP2015136059A/en active Pending
- 2014-12-01 US US15/110,197 patent/US10178417B2/en active Active
- 2014-12-01 CA CA2936164A patent/CA2936164C/en active Active
- 2014-12-01 KR KR1020167018108A patent/KR102103054B1/en active Active
- 2014-12-01 WO PCT/JP2014/081715 patent/WO2015107786A1/en not_active Ceased
- 2014-12-01 EP EP14878795.5A patent/EP3096533B1/en active Active
- 2014-12-01 CN CN201480072676.XA patent/CN105900446B/en active Active
- 2014-12-01 MX MX2016008985A patent/MX384785B/en unknown
-
2016
- 2016-07-08 MX MX2019009888A patent/MX2019009888A/en unknown
-
2018
- 2018-11-02 US US16/179,444 patent/US10820024B2/en active Active
-
2020
- 2020-09-28 US US17/034,591 patent/US11284135B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| EP3096533A4 (en) | 2017-07-05 |
| KR102103054B1 (en) | 2020-04-21 |
| KR20160111021A (en) | 2016-09-23 |
| MX2016008985A (en) | 2016-10-04 |
| US20210029388A1 (en) | 2021-01-28 |
| CN105900446A (en) | 2016-08-24 |
| CA2936164A1 (en) | 2015-07-23 |
| EP3096533A1 (en) | 2016-11-23 |
| US10820024B2 (en) | 2020-10-27 |
| EP3096533B1 (en) | 2020-11-04 |
| US20190075334A1 (en) | 2019-03-07 |
| CA2936164C (en) | 2021-06-01 |
| US10178417B2 (en) | 2019-01-08 |
| US20160330491A1 (en) | 2016-11-10 |
| MX384785B (en) | 2025-03-04 |
| CN105900446B (en) | 2019-11-05 |
| WO2015107786A1 (en) | 2015-07-23 |
| US11284135B2 (en) | 2022-03-22 |
| MX2019009888A (en) | 2019-10-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102120525B1 (en) | Communication apparatus, communication data generation method, and communication data processing method | |
| US11284135B2 (en) | Communication apparatus, communication data generation method, and communication data processing method | |
| US10924524B2 (en) | Communication devices, communication data generation method, and communication data processing method | |
| KR102176404B1 (en) | Communication apparatus, communication data generation method, and communication data processing method |