Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.
Science et technologie

OpenAI recherche des organisations prêtes à fournir leurs données pour entraîner son IA

[ad_1]

Le fournisseur ChatGPT annonce des partenariats de données OpenAI. Avec cette initiative, OpenAI entend convaincre les entreprises de fournir leurs propres jeux de données pour entraîner ses modèles de langage.

On sait que les modèles d’intelligence artificielle sont susceptibles de reproduire des biais et des contenus offensants, voire toxiques (lire à ce sujet : « Modèles de langage géants : des risques à la mesure des capacités »). Pour contrer ce phénomène, les entreprises qui forment des LLM doivent pouvoir disposer de jeux de données aussi vastes que diversifiés. C’est précisément l’ambition d’OpenAI avec son initiative qui vient d’être annoncée, les OpenAI Data Partnerships. « Nous recherchons des partenaires qui souhaitent nous aider à enseigner l’IA à comprendre notre monde afin qu’elle soit la plus utile possible à tous. Ensemble, nous pouvons progresser vers une IA qui profite à l’ensemble de l’humanité », précise la firme à l’origine de ChatGPT.

OpenAI recherche des données de tous domaines et types (texte, images, audio ou vidéo), en particulier celles exprimant une intention humaine (extraits longs plutôt que fragments déconnectés). Les entreprises intéressées à collaborer dans le cadre des partenariats de données OpenAI disposent de deux options. Dans les deux cas, le fournisseur ChatGPT met à disposition ses compétences et technologies en matière de reconnaissance de caractères (OCR), de transcription de discours ou de dialogues, ou encore de nettoyage de données.

Premièrement, il est possible de mettre à disposition les données de l’entreprise pour alimenter des ensembles de données open source. «Cet ensemble de données serait public et pourrait être utilisé par n’importe qui pour former des modèles d’IA. Nous prévoyons également de l’utiliser pour former nous-mêmes en toute sécurité d’autres modèles open source », explique la société fondée par Sam Altman.

Deuxième option : alimenter des ensembles de données privés. « Si vous avez des données que vous souhaitez garder privées, mais que vous souhaitez que nos modèles d’IA comprennent mieux votre domaine (ou que vous souhaitez simplement évaluer le potentiel de vos données à cet égard), c’est la meilleure façon de collaborer. Nous traiterons vos données avec le niveau de sensibilité et de contrôle d’accès que vous souhaitez », déclare OpenAI.

[ad_2]

Gn Ca tech

Back to top button