Cleanlab annonce une avancée d’un milliard de dollars dans la détection des hallucinations de l’IA

-
laboratoire propre

Le modèle linguistique de confiance (TLM) élimine le principal obstacle à l’utilisation commerciale des LLM

SAN FRANCISCO, 25 avril 2024 (GLOBE NEWSWIRE) — Une startup née dans un laboratoire d’informatique quantique a dévoilé la solution à l’un des plus gros problèmes de l’IA générative.

laboratoire propre a lancé aujourd’hui le Modèle linguistique fiable (TLM), une avancée fondamentale dans l’IA générative qui détecte les hallucinations des grands modèles linguistiques (LLM).

Steven Gawthorpe, PhD, directeur associé et scientifique principal des données au Berkeley Research Group, a qualifié le modèle de langage de confiance de « première réponse viable aux hallucinations LLM que j’ai vues ».

L’IA générative est sur le point de transformer tous les secteurs et toutes les professions, mais elle est confrontée à un défi majeur : les « hallucinations », lorsque les LLM génèrent des résultats incorrects ou trompeurs. Une réponse LLM donnée peut sembler convaincante. Mais est-ce correct ? Est-ce basé sur la réalité ? Les LLM n’offrent aucun moyen d’en être sûr. Cela rend pratiquement impossible l’automatisation des tâches sensibles avec l’IA générative.

Le manque de confiance est le obstacle majeur à l’adoption des LLM par les entreprises. Des milliards de dollars de gains de productivité sont enfermés derrière ce dilemme. Cleanlab est le premier à le cracker.

Le TLM de Cleanlab combine une estimation de l’incertitude de classe mondiale, un regroupement automatique de ML et des algorithmes d’information quantique réutilisés pour l’informatique générale afin d’ajouter de la confiance à l’IA générative. Son API s’adapte à n’importe quel LLM, produisant un score de fiabilité fiable pour chaque réponse.

Dans les références standard de l’industrie en matière de fiabilité LLM, le TLM surpasse les autres méthodes dans tous les domaines. Il offre des performances non seulement supérieures, mais constamment supérieures, donnant aux entreprises la confiance nécessaire pour s’appuyer sur l’IA générative pour les tâches importantes.

Par exemple, les entreprises peuvent utiliser le TLM pour automatiser les remboursements des clients, en impliquant un évaluateur humain dans la boucle chaque fois que la réponse d’un LLM tombe en dessous d’un niveau de fiabilité prédéterminé.

Automatiser les demandes de remboursement de manière fiableAutomatiser les demandes de remboursement de manière fiable
Automatiser les demandes de remboursement de manière fiable

« Le TLM de Cleanlab nous donne la puissance de milliers de data scientists pour enrichir les données et renforcer les résultats du LLM, offrant ainsi un retour sur investissement de 10 à 100 x pour nombre de nos clients. Comparés à ce que fait Cleanlab, les autres outils ne sont même pas sur le même terrain de jeu », a déclaré Gawthorpe.

« Le TLM de Cleanlab est une solution véritablement pionnière pour traiter efficacement les hallucinations », a ajouté Akshay Pachaar, ingénieur en IA chez Lightning.ai. « L’intégration des scores de fiabilité de Cleanlab transforme les flux de travail impliquant une intervention humaine, permettant jusqu’à 90 % d’automatisation. Cela permet non seulement d’économiser des centaines d’heures de main-d’œuvre par semaine, mais augmente également notre efficacité dans le traitement d’ensembles de données importants pour l’enrichissement des données, l’analyse des documents et des journaux de discussion et d’autres tâches à grande échelle. Cela a le potentiel de révolutionner la façon dont nous gérons et tirons de la valeur des données.

L’histoire continue

En plus de rendre les LLM plus fiables, le TLM les rend également plus précis. Il fonctionne comme une sorte de super-LLM, vérifiant les résultats des LLM pour fournir de meilleurs résultats que les LLM seuls. dans repères en comparant la précision de GPT4 avec GPT4 + TLM, la combinaison de GPT4 et de TLM surpasse à chaque fois GPT4. Cela rend le TLM idéal pour des scénarios tels que :

  • RAG (Retrieval Augmented Generation) : fournir aux LLM un contexte plus fiable

  • Chatbots d’entreprise : répondre avec précision aux questions des clients et des employés

  • Extraction de données : extraire des informations complexes à partir de PDF

  • Analyse des titres : analyse des analyses boursières pour trouver le signal d’achat le plus fort.

Comme d’autres produits Cleanlab, le TLM trouve ses racines dans les recherches révolutionnaires des fondateurs sur l’incertitude dans les ensembles de données d’IA. Son PDG, Curtis Northcutt, a passé huit ans à travailler avec l’inventeur de l’ordinateur quantique pour comprendre comment extraire des calculs fiables à partir de données arbitraires. Son scientifique en chef, Jonas Mueller, a dirigé le développement d’AutoGluon, la plateforme Auto-ML open source et standard de l’industrie pour AWS. Son CTO, Anish Athlaye, est l’un des développeurs ML les plus renommés au monde, avec plus de 30 000 étoiles GitHub pour ses projets personnels.

AWS, Google, JPMorgan Chase, Tesla et Walmart sont quelques-unes des entreprises Fortune 500 qui utilisent la technologie de Cleanlab pour améliorer leurs saisies de données. Cleanlab applique désormais la même expertise à la production de LLM, avec des implications économiques encore plus importantes.

“Il s’agit d’un point pivot pour l’IA générative dans l’entreprise”, a déclaré Curtis Northcutt, PDG de Cleanlab. «Ajouter de la confiance aux LLM changera le calcul autour de leur utilisation. Nous aurons toujours une certaine version des hallucinations. La différence est que nous disposons désormais d’une solution puissante pour les détecter et les gérer. Cela signifie que les entreprises peuvent déployer l’IA générative pour des cas d’utilisation auparavant inimaginables et débloquer une nouvelle source importante de productivité et de revenus.

Pour en savoir plus sur le Cleanlab TLM pour les entreprises, visitez https://cleanlab.ai/tlm.

À propos de Cleanlab
Fondé en 2021 par trois docteurs en informatique du MIT et approuvé par des centaines d’organisations de premier plan, dont AWS, Chase, Google et Tesla, laboratoire propre ajoute de la confiance à chaque entrée et sortie des processus basés sur les données en transformant des données peu fiables en modèles et informations fiables. La plateforme de données d’IA de Cleanlab, Cleanlab Studio, recherche et corrige automatiquement les erreurs dans les ensembles de données structurés et non structurés, tels que les données visuelles, textuelles et tabulaires, et ajoute plus de 30 dimensions de scores de qualité/confiance pour les points de données. Son modèle linguistique de confiance (TLM) offre le premier moyen fiable d’évaluer la fiabilité des résultats du LLM. Reconnue comme une société Forbes AI 50, Cleanlab est basée à San Francisco et soutenue par des investisseurs de premier plan, notamment Menlo Ventures, Bain Capital Ventures, Databricks Ventures, TQ Ventures, Samsung Ventures et des investisseurs providentiels, notamment les PDG et fondateurs de Yahoo, GitHub, Mosaic et Okta. .

Contact médias
Chris Ulbrich
[email protected]
415-848-9175

Une photo accompagnant cette annonce est disponible sur https://www.globenewswire.com/NewsRoom/AttachmentNg/26d32da4-f3ec-4f6c-a603-e792881b0376

-

PREV Tipp sort de son lit de mort pour sauver le tirage au sort de Walsh Park
NEXT En direct : recherche urgente d’une femme disparue à Truro