Quelles sources de données utilisez-vous pour former votre grand modèle linguistique (LLM) ?

Genesys recueille les données utilisées pour affiner le modèle à partir de conversations en source ouverte et des clients de Genesys Cloud qui acceptent de participer à l'amélioration du produit, y compris les appels vocaux et les chats à partir de divers canaux numériques. Nous veillons à ce que les données couvrent plusieurs domaines et secteurs d'activité, et à ce qu'elles soient rigoureusement examinées pour en vérifier l'intégrité et l'exactitude, par le biais de processus automatisés et d'annotations manuelles.

Les données reflètent les types de conversations que le modèle est censé rencontrer dans des scénarios de production réels. Des mesures sont en place pour atténuer les préjugés liés au domaine, au sexe, à la race ou à d'autres caractéristiques protégées. Genesys applique également des processus stricts pour filtrer le langage inapproprié ; toutes les données sont archivées en toute sécurité dans Genesys Cloud avec un accès étroitement contrôlé.