tencent cloud

音楽認識の導入

PDF
フォーカスモード
フォントサイズ
最終更新日: 2025-11-17 16:20:35

機能概要

音楽認識機能は、Tencent Musicの業界をリードする楽曲認識およびカバー曲認識技術を使用しています。AIとビッグデータに関する長期的な研究に基づき、技術チームはTransformerアーキテクチャとオーディオフィンガープリントアルゴリズムを組み合わせ、多層的な特徴ネットワークを構築しました。これにより、表面的な差異を超え、演奏者、楽器編成、テンポ、調性、さらには音楽スタイルが異なるバージョンと原曲との深層的な関連性を正確に解析し、業界トップクラスの楽曲ライブラリ規模と認識成功率を実現しています。

前提条件

本機能をご利用いただく前に、以下の事前準備を完了させていただく必要があります。
Tencent Cloudアカウントの登録/ログイン、MPSの有効化、サービスロールの権限付与
Tencent Cloudのサブアカウントをご利用の場合は、そのアカウントがMPSを使用するための十分な権限を持っているかを確認してください。
具体的な手順についてはクイックスタートを、アカウントの権限付与に関するご質問はアカウントの権限付与関連ドキュメントをご参照ください。

料金説明

Tencent Cloud Media Processing Service(MPS)の音楽認識は、入力ファイルの再生時間に基づく課金モデルを採用しています。課金ルールの詳細については、スマート認識ケイパビリティ課金項目 - 音楽認識をご参照ください。

音楽認識タスクの開始

方法1:API Explorerによるクイック検証

1. MPSコンソールでサービスを有効化し、COSの権限付与が完了しているかを確認してください。
2. MPSのAPI Explorerオンラインデバッグページに移動し、左側のインターフェースリストからProcessMedia APIを選択します。下の図を参考に、入力パス、出力パス、テンプレートIDなどのパラメータを記入し、AiAnalysisTaskタスク設定でDefinition21(プリセットの音楽認識テンプレート)に設定することで、音楽認識タスクを開始できます。ExtendedParameterは拡張パラメータで、{"tag":{"process_type":"1102"}}と記入する必要があります。


方法2:APIによる開始

上記では、API Explorerを使用してオンラインでインターフェースを呼び出し、デバッグする方法について説明しました。直接Tencent CloudにPOSTリクエストを送信してインターフェースを呼び出せます。リクエストのドメインはmps.tencentcloudapi.comです。POSTリクエストを送信し、definitionをプリセットの音楽認識テンプレートID(21)に設定します。以下はリクエストの参考例です。
注意:
APIを直接呼び出す際、ExtendedParameterパラメータを渡す場合は、JSON文字列をエスケープする必要があります。
{
"InputInfo": {
"Type": "URL",
"UrlInputInfo": {
"Url": "https://data-125xxxxxxx.cos.ap-guangzhou.tencentcos.cn/test/01-%E3%%%B7.mp4"
//入力ファイルのアドレス。実際の呼び出し時には、上記のアドレスを有効なファイルアドレスに置き換えてください
}
},
"OutputStorage": {
"Type": "COS",
"CosOutputStorage": {
"Bucket": "ie-mps-125xxxxxxx",
"Region": "ap-nanjing"
}
},
"OutputDir": "/common/test/tiger/",
"AiAnalysisTask": {
"Definition": 21,
"ExtendedParameter": "{\\"tag\\":{\\"process_type\\":\\"1102\\"}}"
},
"TaskNotifyConfig": {
"TaskNotifyConfig": {
"NotifyUrl": "http://xx.xx.xx.xx:5000//callback"
}
}

コールバック結果の確認

タスク開始後、コールバック結果に基づいて音楽認識の楽曲情報を取得できます。
タグ: 曲名
SpecialInfo構造体
フィールド名
タイプ
説明
song_name
string
曲名
album_name
string
アルバム名
singer_name
string
歌手名
other_singer_list
array
関連歌手リスト
reference_start
int
曲のおおよその開始時刻
reference_end
int
曲のおおよその終了時刻
segment_list
array
曲が出現する時間区間
注意:
コールバック結果のTagSetが[]の場合、オーディオフラグメントにマッチする曲がなかったことを示します。
reference_startとreference_endはあくまで参考値であり、具体的な時間範囲はsegment_listで示されます。検出間隔は15秒であるため、楽曲の実際の存在時間との誤差は15秒以下となります。
返される例:
"AiAnalysisResultSet": [
{
"ClassificationTask": null,
"CoverTask": null,
"DeLogoTask": null,
"DescriptionTask": null,
"FrameTagTask": null,
"HeadTailTask": null,
"HighlightTask": null,
"HorizontalToVerticalTask": null,
"SegmentTask": null,
"TagTask": {
"BeginProcessTime": "2025-06-13T12:08:20Z",
"ErrCode": 0,
"ErrCodeExt": "",
"FinishTime": "2025-06-13T12:08:57Z",
"Input": {
"Definition": 283568
},
"Message": "SUCCESS",
"Output": {
"TagSet": [
{
"Confidence": 100,
"Tag": "繁星",
"SpecialInfo": "{\\"song_mid\\": \\"000Quzkn4N0CBN\\", \\"song_id\\": 521340020, \\"reference_start\\": 30, \\"song_name\\": \\"繁星\\", \\"album_name\\": \\"繁星\\", \\"reference_end\\": 255, \\"singer_name\\": \\"袁娅維TIA RAY\\", \\"segment_list\\": [[30, 165], [180, 255]], \\"other_singer_list\\": [{\\"singer_name\\": \\"蕭敬騰\\"}]}"
}
]
},
"Progress": 100,
"Status": "SUCCESS"
},
"Type": "Tag"
}
]


ヘルプとサポート

この記事はお役に立ちましたか?

フィードバック