Ces écouteurs AI vous permettent d’entendre une seule personne dans une foule en la regardant une seule fois

Ces écouteurs AI vous permettent d’entendre une seule personne dans une foule en la regardant une seule fois
Ces écouteurs AI vous permettent d’entendre une seule personne dans une foule en la regardant une seule fois
-

Les écouteurs antibruit sont devenus très efficaces pour créer une barrière qui filtre les sons externes. Ceci est possible, en gros, grâce à des microphones qui captent l’environnement et l’annulent avec d’autres fréquences. Mais cela annule tous les sons, cela ne permet pas de distinguer ceux qui nous intéressent. Du moins, c’était comme ça jusqu’à présent.

Une équipe de l’Université de Washington a développé un système d’intelligence artificielle qui permet à un utilisateur portant des écouteurs de regarder une personne qui parle pour la « inscrire ». Le système, appelé Target Speech Hearing, annule tous les autres sons de l’environnement et reproduit en temps réel uniquement la voix enregistrée de l’orateur, même lorsque l’auditeur se déplace dans des endroits bruyants et ne regarde plus l’émetteur sonore. L’équipe, dirigée par Shyam Gollakota, a présenté ses conclusions à la conférence ACM CHI sur les facteurs humains dans les systèmes informatiques. Le code du dispositif de validation de principe est disponible pour que d’autres puissent le développer, mais n’est pas disponible dans le commerce pour le moment.

“Quand on considère l’IA comme un chatbot basé sur le site Web qui répond aux questions – explique Gollakota dans un communiqué. Mais dans ce projet, nous développons une IA pour modifier la perceptionsoitentendre quelqu’un d’utiliser des écouteurs, compte tenu de vos préférences. Avec nos appareils, vous pouvez désormais entendre clairement un seul locuteur, même s’il estàs dans un environnement bruyant avec de nombreuses autres personnes qui parlent.

Pour utiliser le système, une personne portant un casque standard équipé de microphones appuie sur un bouton tout en pointe la tête vers quelqu’un qui parle pendant 3 à 5 secondes. Les ondes sonores de la voix de ce locuteur doivent atteindre simultanément les microphones des deux côtés du casque ; Il existe une marge d’erreur de 16 degrés. Les écouteurs envoient ce signal à un ordinateur embarqué, où le logiciel d’apprentissage automatique de la machine apprend les modèles vocaux du locuteur prévu.

Le système capte la voix de cette personne et continue de le jouer pour l’auditeur, même s’ils bougent tous les deux. La capacité du système à se concentrer sur la voix enregistrée s’améliore à mesure que l’orateur continue de parler, fournissant ainsi au système davantage de données d’entraînement. En tenant compte du fait que notre voix pourrait être utilisée comme empreinte digitale, le système associe essentiellement la voix à un modèle spécifique d’ondes sonores et le recherche en permanence.

L’équipe a testé son système sur 21 sujets, qui ont évalué le Clarté de la voix du locuteur enregistré en moyenne presque deux fois supérieure à celle de l’audio non filtré. Actuellement, le système TSH ne peut inscrire qu’un seul locuteur à la fois, et ne peut inscrire un locuteur que lorsqu’il n’y a aucune autre voix forte venant de la même direction que la voix de l’orateur cible. Si un utilisateur n’est pas satisfait de la qualité du son, il peut effectuer un autre enregistrement sur le haut-parleur pour améliorer la clarté. L’équipe travaille à étendre le système aux écouteurs et aux écouteurs à l’avenir.

-

NEXT dans Night City, vous pouvez jouer à Half-Life 3