Speech Application Program Interface (SAPI)

SAPI (Speech Application Program Interface), est une interface de la plate-forme d'exploitation Microsoft Windows qui permet aux programmeurs de créer des programmes avec des capacités de synthèse ou de reconnaissance vocale. Il existe des interfaces pour les langages de programmation Visual Basic, C++ et C++. Utilisant l'architecture COM (Component Object Model) de Microsoft, SAPI est l'interface de programme d'application vocale la plus utilisée aujourd'hui. Microsoft a l'intention d'intégrer la technologie vocale avec SAPI dans ses futurs systèmes d'exploitation.

SAPI se compose de sept éléments. commande vocale : la commande vocale est une interface de haut niveau qui vous permet de contrôler et de prononcer des commandes pour vos applications. La commande vocale permet à un développeur de créer un menu de commande vocale qui contient des commandes vocales, telles que "nouveau fichier" ou "envoyer un courrier à [email protected]" que l'utilisateur prononce dans un microphone ou un autre dispositif audio. L'utilisateur peut contrôler l'ordinateur sans avoir besoin d'un clavier ou d'une souris. Dictée vocale : La dictée vocale permet à l'utilisateur de dicter dans toute application prenant en charge la reconnaissance vocale. Une boîte d'édition invisible ou virtuelle reçoit le texte que l'utilisateur dicte et l'affiche dans une fenêtre de l'application. La Dictée vocale permet le formatage du texte, comme les majuscules, la traduction des mots de ponctuation en symboles de ponctuation, les entrées de glossaire intégrées et la correction du dernier mot prononcé ou d'un mot sélectionné. Les applications qui utilisent la Dictée vocale classent les discours par thèmes qui utilisent différents styles de langage. Ces sujets comprennent l'écriture formelle et le discours de programmation. La Dictée vocale stocke les informations de chaque sujet sur votre disque dur. Texte vocal : Le texte vocal convertit le texte en parole qui est jouée sur les haut-parleurs de l'ordinateur ou envoyée sur une ligne téléphonique. Il existe de nombreuses façons de lire la parole, chacune ayant une voix différente. Téléphone vocal : la téléphonie vocale utilise des contrôles téléphoniques similaires aux contrôles Windows. Les contrôles Windows peuvent inclure des boîtes de liste, des boutons, des curseurs et tout autre objet qui est manipulé avec un clavier ou une souris. Les commandes téléphoniques sont des codes qui reconnaissent les réponses vocales telles que Oui ou Non, votre numéro de téléphone, la date et l'heure. L'utilisateur et l'ordinateur peuvent avoir une conversation à l'aide des commandes téléphoniques. Par exemple, un utilisateur appelle un fournisseur pour commander un article. En parlant à travers le récepteur, l'utilisateur répond à plusieurs questions. Les commandes de téléphonie reconnaissent ces réponses et les envoient à l'application qui traite les réponses. Les contrôles de téléphonie gèrent également les conditions d'erreur (courantes avec les numéros parlés ou lorsque l'appelant ne répond pas) et les variations de réponses telles que "4 janvier" ou "demain". Reconnaissance vocale directe : Il s'agit d'une interface de bas niveau similaire à la commande vocale. La principale différence est que la reconnaissance vocale directe s'adresse directement au moteur vocal. La reconnaissance vocale directe vous donne plus de contrôle sur l'application et l'accélère. Reconnaissance vocale directe : Il s'agit d'une interface de bas niveau similaire à la commande vocale, mais qui parle aussi directement au moteur vocal. Objets audio : Un objet audio indique au moteur vocal d'où il peut tirer son son. Les futurs produits de la technologie vocale vous permettront de naviguer sur l'internet par la parole et de demander à votre téléviseur ce qu'il y a à voir ce soir. Des applications capables de comprendre des concepts sont en cours de développement par des développeurs de logiciels. Si vous demandez à votre ordinateur d'imprimer quelque chose, il indiquera à l'application s'il doit imprimer sur votre imprimante ou sur celle de votre réseau. La technologie vocale est importante pour les professionnels de la santé, les forces de l'ordre, les handicapés physiques, ainsi que pour de nombreux utilisateurs professionnels et privés.

Vous pouvez également être intéressé
  1. MAPI (Messaging Application Program Interface) MAPI (Messaging Application Program Interface) est une interface de programme de Microsoft Windows qui vous permet d'envoyer un courriel à partir d'une application Windows et de joindre le document sur lequel vous travaillez à la note de courriel. Les applications qui tirent parti de MAPI comprennent les traitements de texte,...
  2. TAPI (Telephony Application Program Interface) TAPI (Telephony Application Program Interface) est une interface de programme standard qui vous permet, ainsi qu'à votre ordinateur, de "parler" par téléphone ou visiophone avec des personnes ou des ressources connectées par téléphone ailleurs dans le monde. Si l'interface TAPI est activée sur votre ordinateur et que vous avez installé...

  1. Telephony Application Program Interface (TAPI) TAPI (Telephony App Program Interface) vous permet de "parler" avec votre ordinateur par le biais de lignes téléphoniques ou d'appels vidéo. Il s'agit d'un programme d'interface qui vous permet de parler par téléphone avec des personnes et d'autres ressources connectées par téléphone. Si votre ordinateur est doté de la fonction...
  2. Bug bounty program Les programmes de bug bounty, parfois appelés vulnerability rewards programs (VRP), sont des initiatives de crowdsourcing qui récompensent les personnes qui signalent des bogues logiciels. De nombreux programmes de primes aux bugs sont créés pour compléter les audits de code internes ou les tests de pénétration, dans le cadre du...