Alexa heeft sindskort de optie voor een stem waarmee ze langere content kan voorlezen als podcasts en uitgebreide artikelen. Ze neemt tijdens het oplezen onder meer langere en meer natuurlijke pauzes. The Verge schreef er vorige week over.
Podcasts worden aangenamer met Alexa
Voor korte antwoorden op vragen is de stem en het spreekritme van Alexa natuurlijk prima. Maar je moet er niet aan denken dat ze op die manier een complete podcast voorleest. Of dat ene artikel uit de Volkskrant. Daarom heeft Amazon een aantal nieuwe spreekstijlen uitgebracht die in die behoefte tegemoet kunnen komen. Ontwikkelaars in de Verenigde Staten kunnen er al mee aan de slag en kunnen zo een natuurlijkere stem aan hun oplossingen voor de slimme speaker toevoegen.
Machine learning voor een nieuwe spraakstijl
Volgens Amazon is de ‘longform’ stijl gebaseerd op een deep-learning-text-to-speech-model. Met andere woorden: ze hebben een machine learning model losgelaten op duizenden stemmen, stukken content en andere variabelen om een zo natuurlijk mogelijke spraak te creĆ«ren voor het oplezen van langere content. Alexa neemt in deze nieuwe spraakvorm langere pauzes tijdens het voorlezen. De redacteur van The Verge is teleurgesteld, want die hoort alleen de langere pauzes, maar is nog niet gecharmeerd van het spraakritme.
Beoordeel het zelf via onderstaande links:
Luister naar de ‘normale en neutrale’ stem van Alexa.
Luister naar de ‘longform’ Alexa.
Meer lezen over slimme speaker Alexa van Amazon.