智東西5月17日消息,亞馬遜今日開始將允許Alexa語音應(yīng)用的開發(fā)者免費(fèi)使用8種來自于Amazon Polly的自然語音,讓Alexa的語音應(yīng)用程序能更具特色。這8種自然語音中,男女聲都有,全部采用美式英語發(fā)音。
(Alexa支持的8個自然語音)
一、自然語音?有多自然?
Alexa新?lián)碛械淖匀徽Z音,是通過Amazon Polly提供的。Amazon Polly是亞馬遜提供的基于深度學(xué)習(xí)技術(shù)將文本轉(zhuǎn)換為逼真語音的服務(wù)。
Amazon Polly支持語音合成標(biāo)記語言 (SSML),它是一種基于XML的W3C標(biāo)準(zhǔn)標(biāo)記語言,適用于語音合成應(yīng)用程序,且支持使用通用 SSML標(biāo)簽進(jìn)行斷句、重音和語調(diào)。
簡而言之,Amazon Polly合成的語音有語氣和聲調(diào)的高低起伏、有語速的快慢交替,也會在講話的過程中適時的停頓斷句。
那么,Amazon Polly是如何將它合成的語音發(fā)送到搭載了Alexa的智能設(shè)備上的呢?
Amazon Polly可以為開發(fā)者提供一個 API,借助此 API,開發(fā)者可以將合成語音快速集成到智能設(shè)備的應(yīng)用程序中。開發(fā)者只需將要轉(zhuǎn)換成語音的文本發(fā)送到 Amazon Polly API,Amazon Polly便會立即將音頻流發(fā)送回應(yīng)用程序中。有了這個API,開發(fā)者可以選擇讓用戶在應(yīng)用程序中進(jìn)行即時語音交互,或?qū)?Amazon Polly發(fā)送回來的音頻流以MP3的格式儲存下來。
Amazon Polly支持的語音、語種不止8種,它可以提供幾十種逼真的語音并支持多個語種。此次亞馬遜僅向Alexa語音應(yīng)用的開發(fā)者提供8種美式英語語音,或許是出于Alexa的很大一部分用戶目前集中于美國的原因。
(Amazon Polly支持的部分語音、語種)
二、亞馬遜為何要讓Alexa聽起來不一樣?
首先,讓Alexa能發(fā)出更多不同的聲音,有助于提升用戶使用Alexa的感觀,消除人與機(jī)器之間的距離感。例如,當(dāng)小朋友使用Alexa,讓其讀故事時,不同的語音和起伏的語調(diào)會更讓小朋友有代入感。
其次,科技巨頭們?yōu)榱俗プ「嘤脩?,在技術(shù)應(yīng)用上競爭激烈,亞馬遜此舉應(yīng)該是回應(yīng)谷歌上周于I/O大會上宣布Google Ass
可見,語音助手們?yōu)榱双@得用戶的“芳心”可謂煞費(fèi)苦心。我們是不是可以期待,有一天,語音助手能開口就對我們講出一口流利的四川話/東北話呢?
未經(jīng)允許不得轉(zhuǎn)載:445IT之家 » 亞馬遜不服谷歌 Alexa要支持8種自然語音