Documentation Index
Fetch the complete documentation index at: https://docs.xhuoapi.ai/llms.txt
Use this file to discover all available pages before exploring further.
SUNO дозволяє нам здійснювати вторинну творчість на основі згенерованої музики, отримувати тексти пісень та аудіо часові лінії. У цьому документі описано методи інтеграції відповідних API.
Цей API має лише один вхідний параметр — audio_id, який є офіційним ідентифікатором згенерованої пісні.
Тут ми вводимо audio_id зі значенням ec13e502-d043-4eb2-92ee-e900c6da69d1.
import requests
url = "https://api.xhuoapi.ai/v1/suno/timing"
headers = {
"accept": "application/json",
"authorization": "Bearer {token}",
"content-type": "application/json"
}
payload = {
"audio_id": "ec13e502-d043-4eb2-92ee-e900c6da69d1"
}
response = requests.post(url, json=payload, headers=headers)
print(response.text)
Витяг результату наведено нижче:
{
"success": true,
"task_id": "ccf72cca-1c82-4580-8575-bb141c7e8e48",
"trace_id": "d8e0b7c3-6d24-4ed9-98ac-ffe683576a75",
"data": {
"aligned_words": [
{
"word": "[Verse]\nSnowflakes ",
"success": true,
"start_s": 2.63,
"end_s": 3.43,
"p_align": 0.531
},
{
"word": "dance ",
"success": true,
"start_s": 3.43,
"end_s": 3.91,
"p_align": 0.911
},
{
"word": "on ",
"success": true,
"start_s": 3.91,
"end_s": 4.35,
"p_align": 0.937
},
{
"word": "rooftops ",
"success": true,
"start_s": 4.35,
"end_s": 5.11,
"p_align": 0.366
},
{
"word": "high\n",
"success": true,
"start_s": 5.11,
"end_s": 6.25,
"p_align": 0.969
},
...
],
"waveform_data": [0.02138, 0.02193, 0.01806, 0.16597, 0.15168, 0.14243, ...],
"hoot_cer": 0.35013262599469497,
"is_streamed": false
}
}
Опис поля aligned_words
Як видно, data.aligned_words — це масив об’єктів, кожен з яких представляє слово або фразу з часовою інформацією.
word: фактичне слово або фраза в тексті пісні
success: булеве значення, що вказує, чи було успішним вирівнювання цього слова
start_s: час початку слова (в секундах)
end_s: час закінчення слова (в секундах)
p_align: ймовірність або коефіцієнт довіри вирівнювання, в діапазоні від 0 до 1