KI-Startup erstellt neue Daten für Unternehmen

5f4002dfc8d802e5ec6829b6_og_blog
Übersetzen von : AI-startup skaber friske data til virksomheder
Den KI-Unternehmen mangelt es an neuen Daten, mit denen sie ihre Modelle füttern können, und jetzt könnte die Lösung darin bestehen, andere KI-Modelle neue Daten erstellen zu lassen, mit denen sie die anderen füttern können. Man könnte es zirkuläres KI-Training nennen. Golshan, Mitbegründer von Gretel AI, verrät, wie das Unternehmen synthetische Daten erstellt, um hungrige KI-Modelle zu versorgen.

Seit ChatGPT von OpenAI im Jahr 2022 den Boom der generativen KI auslöste, ist klar, dass die richtigen Daten und zwar ausreichend davon unerlässlich sind, um ein KI-Modell zu erstellen, das genau, zuverlässig und effektiv ist. Das Problem? Die besten Daten, insbesondere spezialisierte „Expertendaten“ in bestimmten Bereichen wie Gesundheit und Finanzen, sind rar.

Gretel KI-Datengenerierung.jpg

KI-Unternehmen haben das Internet nach neuen Informationen durchforstet, aber KI-Modelle sind ständig hungrig und müssen gefüttert werden. Das in San Francisco ansässige Startup Gretel AI glaubt seit langem, dass die zufriedenstellendste Lösung darin besteht, künstlich generierte Daten zu erstellen, die den Eigenschaften realer Daten ähneln. Gretel unterstützt Kunden wie EY, Google und das US-Justizministerium bei der Generierung synthetischer Daten, also künstlich generierter Daten, die die Eigenschaften realer Daten nachahmen.

Gretel AI Startup

Und es wird immer einfacher: Heute gab Gretel beispielsweise die breite Verfügbarkeit eines generativen KI-gestützten Systems bekannt, mit dem Benutzer synthetische Datensätze für tabellarische Daten, Text- und Zahlendaten erstellen können, die in Spalten und Zeilen gespeichert werden, wie z. B. eine Excel-Tabelle , mit nur einem Befehl in natürlicher Sprache.

Wenn eine Bank beispielsweise einen synthetischen Datensatz erstellen möchte, der ihren eigenen Kundendaten ähnelt, kann sie mit Gretas Navigator-Produkt Millionen fiktiver Namen, IDs, Daten, Dollarbeträge und Kontostände erstellen. Die resultierenden computergenerierten Daten verletzen nicht die Privatsphäre der Kunden, da sie keine echten Kundeninformationen enthalten und genügend Daten generieren können, um ein leistungsstarkes, genaues Modell zu trainieren.

In einer Zeit der Datenknappheit, in der Unternehmen auf andere Quellen zurückgreifen müssen, um allgemeine Modelle zu erstellen oder spezifische Aufgaben zu verfeinern, haben synthetische Daten im Jahr 2024 einen großen Durchbruch, sagt Ali Golshan, Mitbegründer und CEO von Gretel, gegenüber Fortune. Das neueste Produkt von Gretel ermöglicht es Unternehmen, Daten zu generieren, auch wenn ihnen Informationen fehlen.

Die Technologie konzentriert sich auf hochspezifische Daten, die dazu dienen sollen, einzelne Aufgaben innerhalb der internen Systeme eines Kunden zu verbessern. Gretel ist nicht die Einzige, die versucht, den Markt für die Generierung synthetischer Daten für KI-Modelle zu erobern. Startups wie SynthLabs, Synthetaic und Clearbox AI wetteifern darum, Unternehmen mit allen benötigten Daten zu versorgen, natürlich computergeneriert.

Gretel AI data.jpg

Gretels nächster großer Schritt besteht darin, einen synthetischen Daten- und Modellaustausch aufzubauen, der das Unternehmen auf die nächste Stufe hebt und es zur sicheren Schnittstelle für private Daten macht. Daten sind die treibende Kraft hinter KI. Und Gretel AI ist definitiv auf dem Weg, einer der innovativsten Player in diesem Bereich zu werden.

Dies hat Golshan und seine Mitbegründer dazu veranlasst, über die Zukunft nachzudenken. Er sagt, dass Unternehmen bald in der Lage sein werden, Geld zu verdienen, indem sie anderen erlauben, synthetische Daten zu kaufen, die auf dem einzigartigen Datensatz der Organisation basieren. Beispielsweise könnten Organisationen, die über viele Daten verfügen, aber keine KI-Modelle erstellen, anderen Zugriff auf ihre Daten verkaufen, um sie beim Training ihrer synthetischen Daten zu unterstützen.

Vor diesem Hintergrund sagte Golshan, Gretels nächster großer Schritt bestehe darin, einen Austausch synthetischer Daten und Modelle aufzubauen. „Wir möchten es Unternehmen und Kunden ermöglichen, Modelle auf der Grundlage ihrer Daten zu trainieren, mathematische Garantien dafür zu erhalten, dass die Daten sicher sind, und jemand kann kommen und dieses Modell „abonnieren“, Daten generieren und nach Belieben bezahlen“, erklärte er.

Dies, fügte er hinzu, werde Gretel auf die nächste Ebene bringen und „zur sicheren Schnittstelle für private Daten werden und diesen ausbeuterischen Ansatz beim Datenabbau und -sammeln beseitigen“. Dies würde auch bedeuten, dass Unternehmen wie Anthropic und OpenAI, die riesige KI-Modelle auf der Grundlage riesiger Datenmengen erstellt haben, nicht mit jedem einzelnen Unternehmen, von dem sie Daten erhalten möchten, Lizenzvereinbarungen abschließen müssten, sagte er.

Was die Finanzierung anbelangt, so hat Gretel mit seiner Serie B, die 2021 fällig ist, insgesamt 68 Millionen US-Dollar eingesammelt. Golshan sagte, das Startup habe noch viel Geld übrig und „wir haben noch etwa zwei Betriebsjahre vor uns“. Aber in diesem „Moment“ für synthetische Daten sieht er eine Chance, die nächsten Databricks oder Snowflake, zwei der größten Daten-Cloud-Plattformen, oder sogar OpenAI zu entwickeln.

„Wir gehen ziemlich aggressiv an die Sache heran, weil wir ein großes Los haben“, sagte er. „Wir stellen uns den Aufbau des nächsten sicheren, qualitativ hochwertigen Datengeschäfts vor, was, wenn man über die Anforderungen nachdenkt, eine ziemlich bedeutende Chance darstellt.“

Our Partners