Marswave OpenAPI User Documentation (1.0.0)

Download OpenAPI specification:

Marswave Team: dev@marswave.ai License: Apache 2.0

This document is the Marswave OpenAPI reference for user-facing endpoints.

Full integration guide: https://blog.listenhub.ai/openapi-docs-en

Authentication

Uses API key authentication, format: Authorization: Bearer < your api key >

Retrieve your API key: Visit the API Keys settings page

user

User-related interfaces

Get user subscription details

Retrieve current user subscription status and credit usage information.

Authorizations:

ApiKeyAuth

Responses

Response samples

200

Content type

application/json

{"code": 0,
"message": "",
"data": {"subscriptionStartedAt": 1718230400000,
"subscriptionExpiresAt": 1720918800000,
"usageAvailableMonthlyCredits": 80,
"usageTotalMonthlyCredits": 100,
"usageAvailablePermanentCredits": 50,
"usageTotalPermanentCredits": 50,
"usageAvailableLimitedTimeCredits": 20,
"totalAvailableCredits": 150,
"resetAt": 1721005200000,
"platform": "web",
"renewStatus": true,
"paidStatus": true,
"subscriptionPlan": {"name": "Pro Monthly",
"duration": "monthly",
"platform": "web"
}
}
}

speakers

Speaker-related interfaces

Get speaker list (including private voices)

Retrieve available voices. When an API Key is provided, the response includes the user's accessible private voices; otherwise only public voices are returned.

query Parameters

language

string

Example: language=en/zh/ja

Filter language type

Responses

Response samples

200

Content type

application/json

{"code": 0,
"message": "",
"data": {"items": [{"name": "American Female",
"speakerId": "speaker_001",
"demoAudioUrl": "https://example.com/demo.mp3",
"gender": "female",
"language": "en"
}
]
}
}

podcast

Podcast-related interfaces

Create Podcast Episode

Create new podcast episode based on provided text and other settings.

Authorizations:

ApiKeyAuth

Request Body schema: application/json
required

query	string Text to be synthesized
	Array of objects Optional, other sources
required	Array of objects [ 1 .. 2 ] items Required, voice type
language	string Enum: "en" "zh" "ja" Optional, en/zh/ja, language type. Default: en (English)
mode	string Enum: "deep" "quick" "debate" Generation mode deep: deep mode, quick: quick mode, debate: debate mode. Default: quick (quick mode)

Responses

Request samples

Payload

Content type

application/json

{"query": "string",
"sources": [{"type": "text",
"content": "string"
}
],
"speakers": [{"speakerId": "string"
}
],
"language": "en",
"mode": "deep"
}

Response samples

200

Content type

application/json

{"code": 0,
"message": "",
"data": {"episodeId": "688c9a27348f001e707ba331"
}
}

Query Podcast episode information

Query detailed information of specified Podcast episode, including blog text, audio content, etc.

Authorizations:

ApiKeyAuth

path Parameters

episodeId

required

string

Podcast episode unique identifier

Responses

Response samples

200

Content type

application/json

Example

Query succeeded

{"code": 0,
"message": "",
"data": {"episodeId": "688c9a27348f001e707ba331",
"createdAt": 1718230400,
"message": "success",
"failCode": 0,
"processStatus": "success",
"completedTime": 1718230400,
"sourceProcessResult": {"content": "User-provided source text content",
"references": [ ]
},
"title": "My Podcast Title",
"outline": "This is a podcast outline.",
"cover": "https://example.com/cover.jpg",
"audioUrl": "https://gcs.example.com/audio.mp3",
"audioStreamUrl": "https://gcs.example.com/audio_stream.m3u8",
"scripts": [{"speakerId": "speaker-1",
"speakerName": "Host A",
"content": "This is the first segment content"
}
]
}
}

Get Podcast episode text stream information

Get outline or script text stream content of specified Podcast episode, returned in Server-Sent Events (SSE) format.

Authorizations:

ApiKeyAuth

path Parameters

episodeId

required

string

Podcast episode unique identifier

query Parameters

event

required

string

Enum: "script" "outline"

Query event type (script or outline)

Responses

Create Podcast Episode (Content Only)

Two-stage generation - Stage 1: Generate only podcast content (scripts, outline, etc.), without audio.

After generation completes, you can:

Call the query endpoint to retrieve the generated scripts
Modify the scripts (optional)
Call /v1/podcast/episodes/{episodeId}/audio to generate audio

Authorizations:

ApiKeyAuth

Request Body schema: application/json
required

query	string Text to be synthesized
	Array of objects Optional, other sources
required	Array of objects [ 1 .. 2 ] items Required, voice type
language required	string Enum: "en" "zh" "ja" Required, en/zh/ja, language type. Speaker language must match this parameter
mode	string Enum: "deep" "quick" "debate" Generation mode: deep (deep mode), quick (quick mode), debate (debate mode). Default: quick (quick mode)

Responses

Request samples

Payload

Content type

application/json

{"query": "string",
"sources": [{"type": "text",
"content": "string"
}
],
"speakers": [{"speakerId": "string"
}
],
"language": "en",
"mode": "deep"
}

Response samples

200

Content type

application/json

{"code": 0,
"message": "",
"data": {"episodeId": "688c9a27348f001e707ba331",
"status": "pending",
"message": "Text content generation started. Audio generation can be triggered later."
}
}

Generate Podcast Audio

Two-stage generation - Stage 2: Generate audio based on existing content.

Prerequisites:

Must first call /v1/podcast/episodes/text-content to generate content
Text generation status (contentStatus) must be text-success

Use cases:

First call /v1/podcast/episodes/text-content to generate content
Query and retrieve the generated scripts
Modify the scripts (optional)
Call this endpoint, either with modified scripts or using the original scripts

Authorizations:

ApiKeyAuth

path Parameters

episodeId

required

string

Podcast episode unique identifier

Request Body schema: application/json
optional

Array of objects

Optional, custom scripts array (uses existing scripts if not provided). Podcast scripts must contain 1-2 different speakers.

Responses

Request samples

Payload

Content type

application/json

{"scripts": [{"content": "Welcome to this episode",
"speakerId": "speaker_001"
},
{"content": "Today we're going to discuss an interesting topic",
"speakerId": "speaker_002"
}
]
}

Response samples

200

Content type

application/json

{"code": 0,
"message": "",
"data": {"success": true,
"message": "Audio generation started",
"episodeId": "688c9a27348f001e707ba331",
"status": "pending"
}
}

flowspeech

Flowspeech-related interfaces

Create Flowspeech Episode

Create new flow speech episode based on provided text and other settings.

Authorizations:

ApiKeyAuth

Request Body schema: application/json
required

required	Array of objects = 1 items Required, source information
required	Array of objects [ 1 .. 2 ] items Required, voice type
language	string Enum: "en" "zh" "ja" Optional, en/zh/ja, language type
mode	string Enum: "smart" "direct" Generation mode smart: AI-enhanced mode (fixes grammar, typos, etc.), direct: pass-through mode (no modifications, directly converts to speech)

Responses

Request samples

Payload

Content type

application/json

{"sources": [{"type": "text",
"content": "string",
"uri": "string",
"metadata": { }
}
],
"speakers": [{"speakerId": "string"
}
],
"language": "en",
"mode": "smart"
}

Response samples

200

Content type

application/json

{"code": 0,
"message": "",
"data": {"episodeId": "688c9a27348f001e707ba331"
}
}

Query Flowspeech episode information

Query detailed information of specified Flowspeech episode, including text, audio content, etc.

Authorizations:

ApiKeyAuth

path Parameters

episodeId

required

string

Flowspeech episode unique identifier

Responses

Response samples

200

Content type

application/json

Example

Query succeeded

{"code": 0,
"message": "",
"data": {"episodeId": "flowspeech_episode_001",
"createdAt": 0,
"message": "success",
"failCode": 0,
"processStatus": "success",
"completedTime": 0,
"sourceProcessResult": {"content": "User-provided source text content",
"references": [ ]
},
"title": "My Flowspeech Title",
"outline": "This is a Flowspeech outline.",
"cover": "https://example.com/cover_flowspeech.jpg",
"audioUrl": "https://gcs.example.com/flowspeech_audio.mp3",
"audioStreamUrl": "https://gcs.example.com/flowspeech_audio_stream.m3u8",
"scripts": "This is script content"
}
}

Get Flowspeech episode text stream information

Get outline or script text stream content of specified Flowspeech episode, returned in Server-Sent Events (SSE) format.

Authorizations:

ApiKeyAuth

path Parameters

episodeId

required

string

Flowspeech episode unique identifier

query Parameters

event

required

string

Enum: "script" "outline"

Query event type (script or outline)

Responses

Response samples

200

Content type

text/event-stream

Example

event = script

id: 689ef06042a332af99cd5781
event: script
data: {"code":0, "message":"", "data": {"chunk":"Suddenly turned into a giant watermark frame."}}

id: 689ef06042a332af99cd5781
event: script
data: {"code":0, "message":"", "data": {"chunk":"Every window of this century-old building"}}

id: 689ef06042a332af99cd5781
event: script
data: {"code":0, "message":"", "data": {"chunk":"[END]"}}

text-to-speech

Text-to-Speech interfaces

Direct Speech Engine Call (Synchronous)

Generate audio directly from scripts without creating an Episode, supporting multi-speaker dialogue.

Features:

Synchronous response: Immediately returns audio URL and details
No Episode creation: Does not create any Episode record
Direct conversion: No AI modifications to text content, directly converts to speech
Multi-speaker support: Supports multiple different speakers
Credit deduction: Deducts credits based on actual generated audio length

Use Cases:

Have complete script content and need quick conversion to speech
Need precise control over speaker and content for each sentence
Don't need to save Episode records, only need audio files

Credit Calculation:

Checks if user has sufficient credits before generation
Deducts credits based on actual audioUnits generated
Returns error code 26004 if insufficient credits

Authorizations:

ApiKeyAuth

Request Body schema: application/json
required

required

Array of objects non-empty

Required, script array

Responses

Request samples

Payload

Content type

application/json

{"scripts": [{"content": "Hello everyone, welcome to today's episode",
"speakerId": "speaker_001"
},
{"content": "Today we're going to talk about an interesting topic",
"speakerId": "speaker_002"
}
]
}

Response samples

200

Content type

application/json

Example

Generation successful

{"code": 0,
"message": "",
"data": {"audioUrl": "https://staging-assets.listenhub.ai/listenhub-public-staging/podcast/1eed39d387a046c0a1213e6b8f139d77.mp3",
"audioDuration": 1152,
"subtitlesUrl": "https://staging-assets.listenhub.ai/listenhub-public-staging/podcast/1eed39d387a046c0a1213e6b8f139d77.srt",
"taskId": "1eed39d387a046c0a1213e6b8f139d77",
"credits": 12
}
}

single-speaker-tts

Single speaker TTS generation interfaces

Single Speaker TTS Generation Interface (Streaming Binary Output)

Text-to-speech interface that returns audio binary stream directly.

Features:

Streaming Output: Returns binary audio stream directly without waiting for full generation
Single Speaker: Supports single speaker text-to-speech only
Real-time Response: Audio is returned in real-time as a stream

Use Cases:

Simple single-speaker text-to-speech needs
Scenarios requiring streaming audio output

Differences from /v1/speech:

/v1/tts: Streaming binary output, single speaker, real-time return
/v1/speech: JSON response, multi-speaker support, synchronous URL return

Credit Calculation:

Credits are deducted based on actual generated audio length
Returns error code 26004 if insufficient credits

Authorizations:

ApiKeyAuth

Request Body schema: application/json
required

input required	string Text content to be converted to speech
voice required	string Speaker ID (speakerId)
model	string Default: "flowtts" Model name (optional, default: flowtts). Note: This parameter is currently not processed, for compatibility only

Responses

Request samples

Payload

Content type

application/json

{"input": "The weather is beautiful today, perfect for a walk outside.",
"voice": "speaker_001",
"model": "flowtts"
}

Response samples

200

Content type

audio/mpeg

No sample

📘 Error Codes

System Error Codes

Code	Description	Suggested Action
21007	Invalid API key	Verify that the API key is configured correctly
25002	Resource not found	Check whether the requested resource ID exists
25008	Invalid episode status	Verify that text content generation is complete and contentStatus is text-success
26004	Insufficient credits	Review account credit balance, upgrade the plan, or contact support
29003	Invalid parameters	Validate request parameter formats and required fields
29998	Too many requests	Implement exponential backoff retries; wait 20-30 seconds between attempts

Content Generation Error Codes

Code	Description	Applicable APIs
91001	Content too short	Podcast, FlowSpeech
91002	Content violates policy	Podcast, FlowSpeech
91003	Search failed	Podcast, FlowSpeech
91004	Unable to retrieve content	Podcast, FlowSpeech
91005	Unable to access URL content	Podcast, FlowSpeech
91006	Processing failed	Podcast, FlowSpeech
91007	File size too large	Podcast, FlowSpeech

Error Response Format

All errors are returned in HTTP 200 responses and differentiated by the code field:

{
  "code": 21007,
  "message": "Invalid user APIKey",
  "data": {}
}

Error Handling Examples

System Errors

When the API returns a system error code, you usually need to fix the request parameters or inspect the account status.

Content Generation Errors

When a polling endpoint returns success (code: 0) but data.failCode is present, the content generation has failed:

{
  "code": 0,
  "message": "",
  "data": {
    "episodeId": "xxx",
    "processStatus": "failed",
    "failCode": 91001,
    "message": "Content is too short"
  }
}

Marswave OpenAPI User Documentation (1.0.0)

Authentication

user

Get user subscription details

Authorizations:

Responses

Response samples

speakers

Get speaker list (including private voices)

query Parameters

Responses

Response samples

podcast

Create Podcast Episode

Authorizations:

Request Body schema: application/jsonrequired

Responses

Request samples

Response samples

Query Podcast episode information

Authorizations:

path Parameters

Responses

Response samples

Get Podcast episode text stream information

Authorizations:

path Parameters

query Parameters

Responses

Create Podcast Episode (Content Only)

Authorizations:

Request Body schema: application/jsonrequired

Responses

Request samples

Response samples

Generate Podcast Audio

Authorizations:

path Parameters

Request Body schema: application/jsonoptional

Responses

Request samples

Response samples

flowspeech

Create Flowspeech Episode

Authorizations:

Request Body schema: application/jsonrequired

Responses

Request samples

Response samples

Query Flowspeech episode information

Authorizations:

path Parameters

Responses

Response samples

Get Flowspeech episode text stream information

Authorizations:

path Parameters

query Parameters

Responses

Response samples

text-to-speech

Direct Speech Engine Call (Synchronous)

Authorizations:

Request Body schema: application/jsonrequired

Responses

Request samples

Response samples

single-speaker-tts

Single Speaker TTS Generation Interface (Streaming Binary Output)

Authorizations:

Request Body schema: application/jsonrequired

Responses

Request samples

Response samples

📘 Error Codes

System Error Codes

Content Generation Error Codes

Error Response Format

Error Handling Examples

System Errors

Request Body schema: application/json
required

Request Body schema: application/json
required

Request Body schema: application/json
optional

Request Body schema: application/json
required

Request Body schema: application/json
required

Request Body schema: application/json
required