Apple forme Siri pour détecter et s’adapter aux utilisateurs qui bégaient à l’aide de la recherche et du catalogue de podcasts

Apple forme Siri pour détecter et s’adapter aux utilisateurs qui bégaient à l’aide de la recherche et du catalogue de podcasts

Apple étudie des moyens d’améliorer son assistant vocal Siri pour les utilisateurs aux modes de parole atypiques, confirme la société au le journal Wall Street. Selon le rapport, Apple exploite sa bibliothèque de podcasts pour des échantillons vocaux qui pourraient entraîner Siri à s’adapter aux utilisateurs qui parlent avec un bégaiement.

Voici les nouvelles du le journal Wall Street rapport:

La société recherche actuellement comment détecter automatiquement si quelqu’un parle avec un bégaiement et a construit une banque de 28000 clips audio à partir de podcasts contenant du bégaiement pour aider à le faire, selon un article de recherche qui doit être publié par les employés d’Apple cette semaine. vu par le Wall Street Journal.

Pour l’instant, Apple s’appuie sur sa fonction Hold to Talk comme méthode pour interagir avec Siri sans que l’assistant vocal coupe les utilisateurs avec des modèles de parole plus lents que prévu, mais interagir physiquement avec un appareil n’est pas toujours pratique.

Siri peut être activé par la voix sur les iPhones, iPad et Mac, et en particulier HomePod et HomePod mini, à l’aide de la commande vocale «Hey Siri» suivie d’une demande. Pour les utilisateurs qui bégaient, cependant, la version actuelle de Siri interprète généralement les pauses dans la parole comme la fin d’une commande vocale. À son tour, cela empêche l’assistant vocal d’atteindre son plein potentiel pour une collection de clients.

L’ami du site, Steve Aquino, a évoqué le document de recherche Apple référencé dans le WSJ rapport.

Voici le résumé de la recherche d’Apple:

La capacité de détecter automatiquement les événements de bégaiement dans la parole pourrait aider les orthophonistes à suivre la fluidité d’un individu au fil du temps ou aider à améliorer les systèmes de reconnaissance vocale pour les personnes ayant des modèles de parole atypiques. Malgré l’intérêt croissant pour ce domaine, les ensembles de données publiques existants sont trop petits pour construire des systèmes de détection de dysfluences généralisables et manquent d’annotations suffisantes. Dans ce travail, nous présentons les événements de bégaiement dans les podcasts (SEP-28k), un ensemble de données contenant plus de 28k clips étiquetés avec cinq types d’événements, notamment des blocs, des prolongations, des répétitions sonores, des répétitions de mots et des interjections. L’audio provient de podcasts publics composés en grande partie de personnes qui bégaient en interviewant d’autres personnes qui bégaient. Nous comparons un ensemble de modèles acoustiques sur SEP-28k et l’ensemble de données public FluencyBank et soulignons à quel point le simple fait d’augmenter la quantité de données d’entraînement améliore les performances de détection relatives de 28% et 24% F1 sur chacun. Les annotations de plus de 32 000 clips sur les deux ensembles de données seront rendues publiques.

Le document de recherche a reconnu que l’approche actuelle pour régler Siri pour la dysfluence est une approche, il reste une opportunité d’améliorer l’effort en utilisant des modèles de langage et d’autres méthodes.

Enfin, Apple conclut que si ses recherches actuelles se concentrent sur les utilisateurs qui bégaient, les recherches futures devraient explorer d’autres catégories comme la dysarthrie qui ont des caractéristiques différentes.


Consultez 9to5Mac sur YouTube pour plus d’informations sur Apple:

Articles similaires

Flipkart acquiert Cleartrip pour renforcer sa présence en ligne

Flipkart acquiert Cleartrip pour renforcer sa présence en ligne

Verizon vs T-Mobile vs AT&T: qui gagne les guerres 5G au début de 2021?

Verizon vs T-Mobile vs AT&T: qui gagne les guerres 5G au début de 2021?

«  Ian’s Awesome Counter  » pour Apple Watch vise à vous aider à être plus concentré et conscient

«  Ian’s Awesome Counter  » pour Apple Watch vise à vous aider à être plus concentré et conscient

Les nouveaux Amazon Echo Buds sont plus petits, plus légers et meilleurs qu’avant

Les nouveaux Amazon Echo Buds sont plus petits, plus légers et meilleurs qu’avant

Articles récents