Die Antwort von Chatbot ist erfunden: Neues Tool hilft Ihnen

Übersetzen von : Chatbots svar er opfundet: Ny værktøj hjælper dig

Cleanlab wird große Sprachmodelle für Unternehmen attraktiver machen, die über ihre Tendenz, Informationen zu erfinden, besorgt sind. Mit ihrem zuverlässigen Sprachmodell können Unternehmen jetzt von KI profitieren, ohne sich über Fehlinformationen Sorgen machen zu müssen.

Auf Maria

27 apr. 2024 kl. 07:00

Cleanlab hofft, dass ihr Tool große Sprachmodelle für Unternehmen attraktiver macht, die sich Sorgen darüber machen, wie viel sie erfinden können. „Ich denke, die Leute wissen, dass große Sprachmodelle die Welt verändern werden, aber sie hängen nur an diesen dummen Halluzinationen fest“, sagt Curtis Northcutt, CEO von Cleanlab. Chatbots werden zur dominanten Art und Weise, wie Menschen am Computer nach Informationen suchen.

Suchmaschinen werden rund um diese Technologie neu gestaltet. Office-Software, die täglich von Milliarden von Menschen für alles verwendet wird, von Schularbeiten bis hin zum Marketing, verfügt jetzt über integrierte Chatbots. Dennoch ergab eine November-Studie von Vectara, einem von ehemaligen Google-Mitarbeitern gegründeten Startup, dass Chatbots in mindestens 3 % der Fälle Informationen erfinden.

Bereinigen Sie Lab.webp

Das hört sich vielleicht nicht nach viel an, ist aber eine Fehlertoleranz, die die meisten Unternehmen nicht akzeptieren. Das Tool von Cleanlab wird bereits von einer Handvoll Unternehmen genutzt, darunter der Berkeley Research Group, einem britischen Beratungsunternehmen, das sich auf Unternehmensstreitigkeiten und -ermittlungen spezialisiert hat. Steven Gawthorpe, stellvertretender Direktor der Berkeley Research Group, sagt, dass das vertrauensbildende Sprachmodell von Cleanlab die erste praktikable Lösung für das Halluzinationsproblem ist, das er gesehen hat.

Im Jahr 2021 entwickelte Cleanlab eine Technologie, die Fehler in 34 gängigen Datensätzen erkannte, die zum Trainieren von Algorithmen für maschinelles Lernen verwendet wurden, indem die Unterschiede in der Ausgabe einer Reihe von Modellen gemessen wurden, die auf diesen Daten trainiert wurden. Diese Technologie wird mittlerweile von mehreren großen Unternehmen genutzt, darunter Google, Tesla und dem großen Bankengiganten Chase. Das Trust-Building Language Model nutzt die gleiche Grundidee – dass Meinungsverschiedenheiten zwischen Modellen als Maß für die Vertrauenswürdigkeit des Gesamtsystems verwendet werden können – und wendet sie auf Chatbots an.

In einer Demo, die Cleanlab dem MIT Technology Review gab, gab Northcutt eine einfache Frage in ChatGPT ein: „Wie oft kommt der Buchstabe ‚n‘ in ‚enter‘ vor?“ ChatGPT antwortete: „Der Buchstabe ‚n‘ kommt einmal im Wort ‚enter‘ vor.“ Die richtige Antwort erhöht das Selbstvertrauen. Wenn Sie die Frage jedoch noch ein paar Mal stellen, antwortet ChatGPT: „Der Buchstabe ‚n‘ kommt im Wort ‚enter‘ zweimal vor.“

„Ergebnisse sind nicht nur oft falsch, sie sind auch zufällig, man weiß nie, was ausgegeben wird“, sagt Northcutt. „Warum kann es nicht einfach sagen, dass es ständig unterschiedliche Antworten gibt?“ Das Ziel von Cleanlab ist es, diese Zufälligkeit experimenteller zu machen.

Northcutt stellt dem Trust-Building Language Model die gleiche Frage. „Der Buchstabe ‚n‘ kommt einmal im Wort ‚enter‘ vor“, antwortet es und bewertet seine Antwort mit 0,63. Sechs von 10 Punkten ist kein guter Wert und deutet darauf hin, dass die Antwort des Chatbots auf diese Frage nicht als zuverlässig angesehen werden sollte. Es ist ein einfaches Beispiel, aber es verdeutlicht den Punkt.

cleanlab-secures-25-million-in-series-a-funding-for-data-v0-vzNpd6o-b9eJfbITtxJA0zuPpBMOSs_Jg8Wj3kPaOAo.webp

Ohne die Punktzahl würde man meinen, der Chatbot wüsste, wovon er spricht, sagt Northcutt. Das Problem ist, dass Informatiker, die große Sprachmodelle in Hochrisikosituationen testen, durch ein paar richtige Antworten in die Irre geführt werden können und davon ausgehen, dass zukünftige Antworten auch richtig sein werden: „Sie probieren Dinge aus, sie probieren ein paar Beispiele aus und sie denken, es funktioniert.“ Und dann treffen sie Entscheidungen, die zu wirklich schlechten Geschäftsentscheidungen führen.“

Aktuelle software

28 Aug

software

Die neue KI-Funktion von Google Meet macht sich No
07 Aug

software

Musk verklagt OpenAI wegen Profitorientierung
07 Aug

software

OpenAI verabschiedet sich von Top-Managern
01 Aug

software

Google-KI-Systeme erzielen Durchbrüche in der Math
29 Jul

software

AMD Amuse: Neues KI-Grafiktool für Ryzen und Radeo
26 Jul

software

Logitech G kündigt MIXLINE an
28 Jun

software

Chinesisches KI-Unternehmen bildet LLMs bei Huawei
26 Jun

software

Die ChatGPT-Desktop-App für Mac ist fertig

Die Antwort von Chatbot ist erfunden: Neues Tool hilft Ihnen

Aktuelle software

Die neue KI-Funktion von Google Meet macht sich No

Musk verklagt OpenAI wegen Profitorientierung

OpenAI verabschiedet sich von Top-Managern

Google-KI-Systeme erzielen Durchbrüche in der Math

AMD Amuse: Neues KI-Grafiktool für Ryzen und Radeo

Logitech G kündigt MIXLINE an

Chinesisches KI-Unternehmen bildet LLMs bei Huawei

Die ChatGPT-Desktop-App für Mac ist fertig

Die meisten gelesenen software

Empfohlen von Tweak

Our Partners