tencent cloud

Video on Demand

ビデオコンテンツの分析

PDF
フォーカスモード
フォントサイズ
最終更新日: 2023-10-26 17:39:30
ビデオコンテンツ分析は、AIの力を借りてオーディオビデオコンテンツに対してインテリジェントな分析を行う機能であり、オフラインタスクです。オーディオビデオコンテンツ分析を使用することで、ビデオのクラシフィケーション(分類)、タグづけ、カバー画像のキャプチャなどに対してインテリジェントなアドバイスを与え、ビデオプラットフォームでビデオを的確かつ効率的に管理ができるようにサポートします。
オーディオビデオコンテンツ分析には、以下の機能が含まれます。
機能名
説明
スマート分類
ビデオが属するカテゴリーを提案します。現在は次の10余りのカテゴリーがあります。
ニュース、エンターテインメント、ゲーム、テクノロジー、グルメ、スポーツ、旅行、アニメ漫画、ダンス、ミュージック、映画TV、自動車など。
インテリジェントタグ
ビデオに付けることができるタグを提案します。現在は計3000種余りのタグがあり、例えば次のようなものがあります。
ゲーム、交通手段、ミュージシャン、レース、ペット、ドラム、自転車、World of Warcraft、コンピュータ、学校、ジャケットなど。
サムネイル画像のスマート生成
ビデオの中から1枚または何枚かのスクリーンキャプチャを選定し、カバー画像としての採用を推奨します。
フレーム別インテリジェントタグ
ビデオの1フレームの画面ごとに付けることができるタグを提案します。現在は計1000種余りのタグがあり、例えば次のようなものがあります。
モダンダンス、水上スポーツ、ステーキ、ベビー、子猫、一年生植物、駆逐艦、漫画、芝生、ウェディングドレス、多機能ホール、パスポートなど。

オーディオビデオコンテンツ分析テンプレート

オーディオビデオコンテンツ分析のパラメータによって、分析タスクで具体的にどの項目の分析操作を実行するかを制御することができます。VODではオーディオビデオコンテンツ分析テンプレートを使用して、インテリジェント分析のパラメータグループを表示します。
インテリジェントクラシフィケーションのアクティブ化の有無。
インテリジェントタグのアクティブ化の有無。
インテリジェントカバー画像のアクティブ化の有無。
フレーム別インテリジェントタグのアクティブ化の有無。
一般的な操作の組み合わせを対象に、Video on Demandでは、プリセットオーディオビデオコンテンツ分析テンプレートを提供しています。その他、サーバーAPIを呼び出してカスタマイズしたオーディオビデオコンテンツ分析テンプレートを作成し、管理することができます。

タスクの開始

オーディオビデオコンテンツ分析タスクの開始には、「サーバーAPIから直接開始」、「コンソールから直接開始」、「アップロード時に実行したいタスクを指定」の3種類の方法があります。詳細内容は、ビデオ処理のタスクの開始をご参照ください。
以下は、各方法のオーディオビデオコンテンツ分析タスク開始についての説明です。
サーバーAPIProcessMediaの呼び出しによるタスク開始:リクエストの中のAiAnalysisTaskパラメータでオーディオビデオコンテンツ分析テンプレートのテンプレートIDを指定します。
コンソールでのビデオに対するタスク開始:サーバーAPIを呼び出してタスクフローを作成し、タスクフローの中でオーディオビデオコンテンツ分析タスクを設定します(MediaProcessTask.AiAnalysisTaskの中で指定)。コンソールでこのタスクフローを使用してビデオ処理を開始します。
サーバーからのアップロード時にタスクを指定: サーバーAPIを呼び出してタスクフローを作成し、タスクフローの中でオーディオビデオコンテンツ分析タスクを設定します(MediaProcessTask.AiAnalysisTaskの中で指定)。アップロードの申請procedureパラメータでこのタスクフローを指定します。
クライアントからのアップロード時にタスクを指定: サーバーAPIを呼び出してタスクフローを作成し、タスクフローの中でオーディオビデオコンテンツ分析タスクを設定します(MediaProcessTask.AiAnalysisTaskの中で指定)。クライアントからのアップロード署名procedureでこのタスクフローを指定します。
コンソールからのアップロード:サーバーAPIを呼び出してタスクフローを作成し、タスクフローの中でオーディオビデオコンテンツ分析タスクを設定します(MediaProcessTask.AiAnalysisTaskの中で指定)。コンソールでビデオをアップロードし、アップロードと同時にビデオに対する処理操作を実行を選択して、ビデオアップロード後にこのタスクフローの実行を指定します。

結果の取得

オーディオビデオコンテンツ分析タスクを開始した後、非同期の結果通知を待機するか、またはタスク確認を同期的に実行する方法のどちらかでビデオコンテンツ分析タスクの実行結果を取得できます。以下は、ビデオコンテンツ分析タスクの開始後、通常のコールバック方式での結果通知の例となります(値がnullのフィールドは省略)。
{
"EventType":"ProcedureStateChanged",
"ProcedureStateChangeEvent":{
"TaskId":"1256768367-Procedure-2e1af2456351812be963e309cc133403t0",
"Status":"FINISH",
"FileId":"5285890784246869930",
"FileName":"アニマルワールド",
"FileUrl":"http://1256768367.vod2.myqcloud.com/xxx/xxx/AtUCmy6gmIYA.mp4",
"MetaData":{
"AudioDuration":60,
"AudioStreamSet":[
{
"Bitrate":383854,
"Codec":"aac",
"SamplingRate":48000
}
],
"Bitrate":1021028,
"Container":"mov,mp4,m4a,3gp,3g2,mj2",
"Duration":60,
"Height":480,
"Rotate":0,
"Size":7700180,
"VideoDuration":60,
"VideoStreamSet":[
{
"Bitrate":637174,
"Codec":"h264",
"Fps":23,
"Height":480,
"Width":640
}
],
"Width":640
},
"AiAnalysisResultSet":[
{
"Type":"Classification",
"ClassificationTask":{
"Status":"SUCCESS",
"ErrCode":0,
"Message":"",
"Input":{
"Definition":10
},
"Output":{
"ClassificationSet":[
{
"Classification":"動物",
"Confidence":80
},
{
"Classification":"旅行",
"Confidence":34
}
]
}
}
},
{
"Type":"Cover",
"CoverTask":{
"Status":"SUCCESS",
"ErrCode":0,
"Message":"",
"Input":{
"Definition":10
},
"Output":{
"CoverSet":[
{
"CoverUrl":"http://1256768367.vod2.myqcloud.com/xxx/xxx/xxx1.jpg",
"Confidence":79
},
{
"CoverUrl":"http://1256768367.vod2.myqcloud.com/xxx/xxx/xxx2.jpg",
"Confidence":70
},
{
"CoverUrl":"http://1256768367.vod2.myqcloud.com/xxx/xxx/xxx3.jpg",
"Confidence":66
}
]
}
}
},
{
"Type":"Tag",
"TagTask":{
"Status":"SUCCESS",
"ErrCode":0,
"Message":"",
"Input":{
"Definition":10
},
"Output":{
"TagSet":[
{
"Tag":"馬",
"Confidence":34
},
{
"Tag":"鳥",
"Confidence":27
},
{
"Tag":"植物",
"Confidence":13
},
{
"Tag":"ビーチ",
"Confidence":11
}
]
}
}
}
],
"TasksPriority":0,
"TasksNotifyMode":""
}
}
コールバックの結果の中で、ProcedureStateChangeEvent.AiAnalysisResultSetTypeClassificationCoverTagの3種類の分析結果がありますが、それぞれビデオインテリジェントクラシフィケーション、ビデオインテリジェントカバー画像、ビデオインテリジェントタグを表します。
TypeClassificationの結果では、Output.ClassificationSetの信頼度が最も高いカテゴリーが動物、その次のカテゴリーが旅行と示されています。
TypeCoverの結果Output.CoverSetには、3つの採用を推奨するカバー画像が示されています。CoverUrlがカバー画像に対応するダウンロードアドレスです。
TypeTagの結果Output.TagSetには、4つの採用を推奨するビデオのタグが示され、信頼度の順に上から下へ配列されています。

ヘルプとサポート

この記事はお役に立ちましたか?

フィードバック