Hoppa till huvudinnehåll

Documentation Index

Fetch the complete documentation index at: https://docs.xhuoapi.ai/llms.txt

Use this file to discover all available pages before exploring further.

SUNO tillåter oss att göra sekundär skapande av genererad musik, och att hämta låttexter och ljudets tidslinje. Detta dokument förklarar hur man integrerar med den relaterade API:n. API:et har endast en ingångsparameter, nämligen audio_id, som är det officiellt genererade låt-ID:t. Här använder vi audio_id värdet ec13e502-d043-4eb2-92ee-e900c6da69d1.
import requests

url = "https://api.xhuoapi.ai/v1/suno/timing"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "audio_id": "ec13e502-d043-4eb2-92ee-e900c6da69d1"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)
Resultatet utdraget nedan:
{
  "success": true,
  "task_id": "ccf72cca-1c82-4580-8575-bb141c7e8e48",
  "trace_id": "d8e0b7c3-6d24-4ed9-98ac-ffe683576a75",
  "data": {
    "aligned_words": [
      {
        "word": "[Verse]\nSnowflakes ",
        "success": true,
        "start_s": 2.63,
        "end_s": 3.43,
        "p_align": 0.531
      },
      {
        "word": "dance ",
        "success": true,
        "start_s": 3.43,
        "end_s": 3.91,
        "p_align": 0.911
      },
      {
        "word": "on ",
        "success": true,
        "start_s": 3.91,
        "end_s": 4.35,
        "p_align": 0.937
      },
      {
        "word": "rooftops ",
        "success": true,
        "start_s": 4.35,
        "end_s": 5.11,
        "p_align": 0.366
      },
      {
        "word": "high\n",
        "success": true,
        "start_s": 5.11,
        "end_s": 6.25,
        "p_align": 0.969
      },
      ...
    ],
    "waveform_data": [0.02138, 0.02193, 0.01806, 0.16597, 0.15168, 0.14243, ...],
    "hoot_cer": 0.35013262599469497,
    "is_streamed": false
  }
}

Förklaring av fältet aligned_words

Som vi kan se är data.aligned_words en array av objekt, där varje objekt representerar ett ord eller en fras med tidsinformation.
  • word: Det faktiska ordet eller frasen i låttexten
  • success: Boolean som indikerar om just detta ords tidsjustering lyckades
  • start_s: Starttid för ordet i sekunder
  • end_s: Sluttid för ordet i sekunder
  • p_align: Sannolikhet eller förtroendescore för justeringen, i intervallet 0 till 1