Returns information about a transcription job
Transcription Job Details
Request Unauthorized
User does not have permission to access this deployment
Job Not Found
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/{id}" -H "Authorization: Bearer $REV_ACCESS_TOKEN"
{- "id": "Umx5c6F7pH7r",
- "status": "in_progress",
- "language": "en",
- "created_on": "2018-05-05T23:23:22.29Z",
- "transcriber": "machine"
}
Deletes a transcription job. All data related to the job, such as input media and transcript, will be permanently deleted. A job can only be deleted once it's completed (either with success or failure).
Job was successfully deleted
Request Unauthorized
User does not have permission to access this deployment
Job Not Found
Conflict
curl -X DELETE "https://api.rev.ai/speechtotext/v1/jobs/{id}" -H "Authorization: Bearer $REV_ACCESS_TOKEN"
{- "title": "Authorization has been denied for this request",
- "status": 401
}
Gets a list of transcription jobs submitted within the last 30 days in reverse chronological order up to the provided limit
number of jobs per call. Note: Jobs older than 30 days will not be listed. Pagination is supported via passing the last job id
from a previous call into starting_after
.
List of Rev AI Transcription Jobs
Bad Request
Request Unauthorized
User does not have permission to access this deployment
# Get list of jobs with a limit of 10 jobs curl -X GET "https://api.rev.ai/speechtotext/v1/jobs?limit=10" -H "Authorization: Bearer $REV_ACCESS_TOKEN" # Get list of jobs starting after (submitted before) job with id Umx5c6F7pH7r curl -X GET "https://api.rev.ai/speechtotext/v1/jobs?starting_after=Umx5c6F7pH7r" -H "Authorization: Bearer $REV_ACCESS_TOKEN"
[- {
- "id": "Umx5c6F7pH7r",
- "status": "in_progress",
- "created_on": "2018-05-05T23:23:22.29Z",
- "type": "async",
- "delete_after_seconds": 50,
- "transcriber": "machine"
}
]
Starts an asynchronous job to transcribe speech-to-text for a media file. Media files can be specified in two ways, either by including a public url to the media in the transcription job options
or by uploading a local file as part of a multipart/form request.
Transcription Job Options
media_url | string <= 2048 characters Deprecated [HIPAA Unsupported] Deprecated. Use source_config instead.
Direct download media url. Ignored if submitting job from file.
**Note:**Most languages support media files with duration up to 17 hours, with the exception for Telugu ( | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
object or null Optional authorization headers, if they are needed to access the resource at the URL. Headers could be
a single | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
metadata | string or null <= 512 characters Optional metadata that was provided during job submission. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
callback_url | string or null <= 1024 characters Deprecated Deprecated. Use notification_config instead. Optional callback url to invoke when processing is complete.
If this parameter is used to pass in the callback url, the callback url will be visible in the response.
It is recommended to provide webhooks with the | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
object or null Optional configuration for a callback url to invoke when processing is complete, in addition to auth
headers if they are needed to invoke the callback url.
Cannot be set if | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
delete_after_seconds | integer or null [ 0 .. 2592000 ] Amount of time after job completion when job is auto-deleted. Present only when preference set in job request. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
transcriber | string or null Default: "machine" Select which service you would like to transcribe this file with.
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
verbatim | boolean Configures the transcriber to transcribe every syllable. This will include all false starts and disfluencies in the transcript. The behavior depends on the transcriber option:
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
rush | boolean or null Default: false [HIPAA Unsupported] Only available for | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
test_mode | boolean or null Default: false [HIPAA Unsupported] Only available for | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Array of objects or null [HIPAA Unsupported] Only available for | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Array of objects or null [ 0 .. 100 ] items [HIPAA Unsupported] Only available for | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
skip_diarization | boolean or null Default: false Specify if speaker diarization will be skipped by the speech engine | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
skip_postprocessing | boolean or null Default: false Only available for English and Spanish languages. User-supplied preference on whether to skip post-processing operations such as inverse text normalization (ITN), casing and punctuation. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
skip_punctuation | boolean or null Default: false Specify if "punct" type elements will be skipped by the speech engine. For JSON outputs, this includes removing spaces. For text outputs, words will still be delimited by a space | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
remove_disfluencies | boolean or null Default: false Currently we only define disfluencies as 'ums' and 'uhs'. When set to true, disfluencies will not appear in the transcript.
This option also removes atmospherics if the | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
remove_atmospherics | boolean or null Default: false We define many atmospherics such | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
filter_profanity | boolean or null Default: false Enabling this option will filter for approx. 600 profanities, which cover most use cases. If a transcribed word matches a word on this list, then all the characters of that word will be replaced by asterisks except for the first and last character. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
speaker_channels_count | integer or null [ 1 .. 8 ] Only available for English, Spanish and French languages. Use to specify the total number of unique speaker channels in the audio. Given the number of audio channels provided, each channel will be transcribed
separately and the channel id assigned to the Best practice:
Note:
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
speakers_count | integer or null >= 1 Default: null Only available for English, Spanish and French languages. Use to specify the total number of unique speakers in the audio. Given the count of speakers provided, it will be used to improve the diarization accuracy. This option is not available for human transcription jobs. Best practice:
Note:
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
diarization_type | string or null Default: "standard" Use to specify diarization type. This option is not available for human transcription jobs and low-cost environment. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
custom_vocabulary_id | string or null This feature is in beta. You can supply the id of a pre-completed custom vocabulary that you submitted through the Custom Vocabularies API instead of uploading the list of phrases using the You cannot use both | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Array of objects [ 1 .. 50 ] items Specify a collection of custom vocabulary to be used for this job. Custom vocabulary informs and biases the speech recognition to find those phrases (at the cost of slightly slower transcription). | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
strict_custom_vocabulary | boolean If true, only exact phrases will be used as custom vocabulary, i.e. phrases will not be split into individual words for processing. By default is enabled. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
object or null Use to specify summarization options. This option is not available for human transcription jobs. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
object or null Use to specify translation options. This option is not available for human transcription jobs. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
language | string or null Default: "en"
Only 1 language can be selected per audio, i.e. no multiple languages in one transcription job.
Additionally, the following parameters may not be used with non-English languages: You can provide a
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
forced_alignment | boolean or null Default: false Provides improved accuracy for per-word timestamps for a transcript. The following languages are currently supported:
This option is not available in low-cost environment |
Transcription Job Details
Bad Request
Request Unauthorized
Request Forbidden
Payload Too Large
Only returned when job is submitted using a local file as part of multipart/form-data
. Submit a job with the source_config
parameter
for files larger than 2GBs
{- "metadata": "example metadata",
- "notification_config": {
- "auth_headers": {
- "Authorization": "Bearer <notification-url-token>"
}
}, - "source_config": {
- "auth_headers": {
- "Authorization": "Bearer <source-url-token>"
}
}, - "transcriber": "machine",
- "skip_diarization": false,
- "skip_punctuation": false,
- "skip_postprocessing": false,
- "remove_disfluencies": false,
- "filter_profanity": false,
- "speaker_channel_count": 1,
- "delete_after_seconds": 2592000,
- "custom_vocabulary_id": null,
- "language": "en"
}
{- "id": "Umx5c6F7pH7r",
- "status": "in_progress",
- "language": "en",
- "created_on": "2018-05-05T23:23:22.29Z",
- "transcriber": "machine"
}
Returns the transcript for a completed transcription job. Transcript can be returned as either JSON or plaintext format. Transcript output format can be specified in the Accept
header. Returns JSON by default.
Note: For streaming jobs, transient failure of our storage during a live session may prevent the final hypothesis elements from saving properly, resulting in an incomplete transcript. This is rare, but not impossible. To guarantee 100% completeness, we recommend capturing all final hypothesis when you receive them on the client.
Rev AI API Transcript
Note: Transcript output format is required in the Accept header. Output can either be in Rev's JSON format or plaintext.
Request Unauthorized
User does not have permission to access this deployment
Job Not Found
Invalid Transcript Format
Conflict
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/{id}/transcript" -H "Authorization: Bearer $REV_ACCESS_TOKEN" -H "Accept: application/vnd.rev.transcript.v1.0+json"
{- "monologues": [
- {
- "speaker": 1,
- "elements": [
- {
- "type": "text",
- "value": "Hello",
- "ts": 0.5,
- "end_ts": 1.5,
- "confidence": 1
}, - {
- "type": "punct",
- "value": " "
}, - {
- "type": "text",
- "value": "World",
- "ts": 1.75,
- "end_ts": 2.85,
- "confidence": 0.8
}, - {
- "type": "punct",
- "value": "."
}
]
}, - {
- "speaker": 2,
- "elements": [
- {
- "type": "text",
- "value": "monologues",
- "ts": 3,
- "end_ts": 3.5,
- "confidence": 1
}, - {
- "type": "punct",
- "value": " "
}, - {
- "type": "text",
- "value": "are",
- "ts": 3.6,
- "end_ts": 3.9,
- "confidence": 1
}, - {
- "type": "punct",
- "value": " "
}, - {
- "type": "text",
- "value": "a",
- "ts": 4,
- "end_ts": 4.3,
- "confidence": 1
}, - {
- "type": "punct",
- "value": " "
}, - {
- "type": "text",
- "value": "block",
- "ts": 4.5,
- "end_ts": 5.5,
- "confidence": 1
}, - {
- "type": "punct",
- "value": " "
}, - {
- "type": "text",
- "value": "of",
- "ts": 5.75,
- "end_ts": 6.14,
- "confidence": 1
}, - {
- "type": "punct",
- "value": " "
}, - {
- "type": "unknown",
- "value": "<inaudible>"
}, - {
- "type": "punct",
- "value": " "
}, - {
- "type": "text",
- "value": "text",
- "ts": 6.5,
- "end_ts": 7.78,
- "confidence": 1
}, - {
- "type": "punct",
- "value": "."
}
]
}
]
}
Returns translated transcript for a completed transcription job. Translation must be requested as part of the submitted job. Transcript can be returned in either JSON or plaintext format. Transcript output format can be specified in the Accept
header. Returns JSON by default.
Rev AI API Transcript
Note: Transcript output format is required in the Accept header. Output can either be in Rev's JSON format or plaintext.
Request Unauthorized
User does not have permission to access this deployment
Job Not Found
Invalid Transcript Format
Conflict
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/{id}/transcript/translation/{language}" -H "Authorization: Bearer $REV_ACCESS_TOKEN" -H "Accept: application/vnd.rev.transcript.v1.0+json"
{- "monologues": [
- {
- "speaker": 1,
- "speaker_info": {
- "id": 1,
- "display_name": "Jane Doe"
}, - "elements": [
- {
- "type": "text",
- "value": "Hello",
- "ts": 0,
- "end_ts": 0,
- "confidence": 0.85
}
]
}
]
}
Returns the transcript summary for a completed transcription job. Summary can be returned as either JSON or plaintext format. Summary output format can be specified in the Accept
header. Returns plaintext by default.
Transcript summary.
Request Unauthorized
User does not have permission to access this deployment
Job Not Found
Conflict
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/{id}/transcript/summary" -H "Authorization: Bearer $REV_ACCESS_TOKEN" -H "Accept: text/plain"
Returns the caption output for a transcription job. We currently support SubRip (SRT) and Web Video Text Tracks (VTT) output.
Caption output format can be specified in the Accept
header. Returns SRT by default.
Note: For streaming jobs, transient failure of our storage during a live session may prevent the final hypothesis elements from saving properly, resulting in an incomplete caption file. This is rare, but not impossible.
Rev AI API Captions
Note: Caption output format is required in the Accept header. The supported headers are application/x-subrip
and text/vtt
.
(SRT)
Request Unauthorized
User does not have permission to access this deployment
Job Not Found
Invalid Job Property
Invalid Caption Format
Conflict
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/{id}/captions" -H "Authorization: Bearer $REV_ACCESS_TOKEN" -H "Accept: application/x-subrip"
1 00:00:01,210 --> 00:00:04,840 Hello there, this is a example captions output 2 00:00:07,350 --> 00:00:10,970 Each caption group is in the SubRip Text file format
Returns translated caption output for a transcription job. Translation must be requested as part of the submited job. We currently support SubRip (SRT) and Web Video Text Tracks (VTT) output.
Caption output format can be specified in the Accept
header. Returns SRT by default.
Rev AI API Captions
Note: Caption output format is required in the Accept header. The supported headers are application/x-subrip
and text/vtt
.
(SRT)
Request Unauthorized
User does not have permission to access this deployment
Job Not Found
Invalid Job Property
Invalid Caption Format
Conflict
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/{id}/captions" -H "Authorization: Bearer $REV_ACCESS_TOKEN" -H "Accept: application/x-subrip"
1 00:00:01,210 --> 00:00:04,840 Hello there, this is an example captions output 2 00:00:07,350 --> 00:00:10,970 Each caption group is in the SubRip Text file format
Get the developer's account information
Rev AI Account
Request Unauthorized
curl -X GET "https://api.rev.ai/speechtotext/v1/account" -H "Authorization: Bearer $REV_ACCESS_TOKEN"
{- "email": "example@rev.ai",
- "free_balance": 5.5,
- "purchased_balance": 8.5,
- "total_balance": 14,
- "invoiced_balance": -9.5,
- "balance_seconds": 0,
- "hipaa_enabled": true
}