Große Sprachmodelle (LLM)

Ein LLM, oder „Large Language Model“, ist ein fortschrittliches Computerprogramm, das darauf trainiert ist, menschliche Sprache zu verstehen und zu generieren. LLMs kann man sich wie extrem erfahrene Bibliothekare vorstellen, die in einer riesigen Bibliothek mit einer Unmenge an Büchern und Texten arbeiten. Diese Bibliothekare haben so viele Texte gelesen, dass sie sehr gut darin geworden sind, Fragen zu beantworten, Texte zu schreiben und sogar Gespräche zu führen, die sich fast wie mit einem echten Menschen anfühlen.

Um dies zu erreichen, verwenden LLMs Algorithmen, die auf künstlicher Intelligenz basieren. Sie werden mit unglaublich großen Mengen an Text – von Webseiten, Büchern, Artikeln und mehr – gefüttert. Dadurch lernen sie, wie Wörter, Sätze und Absätze normalerweise zusammenhängen und können so neue, sinnvolle Texte erzeugen.

Stärken und Schwächen von LLM

Es ist zu sehen, dass LLMs wie GPT-4 ein beeindruckendes Potenzial für verschiedene Anwendungen bieten – doch ihre Schwächen, insbesondere in Bezug auf Zuverlässigkeit, Vorhersagbarkeit und kulturelle Voreingenommenheit, bedürfen sorgfältiger Überlegung und Handhabung.

Stärken

Fähigkeit zur Texterstellung und Übersetzung: LLMs sind besonders effektiv in der Generierung von Texten und der Übersetzung zwischen Sprachen. Sie können überzeugende, menschenähnliche Inhalte in einer Vielzahl von Formaten erstellen, von Zusammenfassungen und Artikeln bis hin zu Briefen und Geschichten.
Massenpersonalisierung: Eine herausragende Fähigkeit von LLMs ist es, Inhalte auf spezifische Zielgruppen oder individuelle Präferenzen zuzuschneiden. Dies ermöglicht eine personalisierte Nutzererfahrung und kann in Marketing und Kommunikation wertvoll sein.
Unterstützung bei Softwareentwicklung: LLMs können effektiv Programmcode generieren, der jedoch angemessene menschliche Aufsicht benötigt. Dies kann die Softwareentwicklung beschleunigen und unterstützen.
Multilinguale Kompetenz: Viele LLMs können in mehreren Sprachen interagieren und maßgeschneiderte Inhalte für unterschiedliche Publika erzeugen, was ihre Anwendbarkeit in globalen Kontexten erhöht.

Schwächen

Begrenzte Kreativität und Vorhersehbarkeit: Während LLMs anfangs beeindruckend und kreativ erscheinen, treten bei intensiverer Nutzung ihre Grenzen hervor. Die von ihnen produzierten Inhalte sind oft ableitend und spiegeln eher die Durchschnittsmeinung ihrer Trainingsdaten wider.
Zuverlässigkeit und Genauigkeit: LLMs neigen dazu, plausibel klingende, aber nicht unbedingt korrekte Informationen zu liefern. Sie können ungenaue, unsinnige oder „halluzinierte“ Inhalte generieren, was ihre Zuverlässigkeit in Frage stellt.
Unvorhersehbarkeit in der Ausgabe: LLMs produzieren oft Inhalte in einem unerwarteten Format, was sie schwierig in traditionelle Softwareanwendungen integrierbar macht, die präzise Inputformate erfordern.
Instabilität und sich ändernde Verhaltensweisen: Neue Versionen von LLMs wie GPT-4 können im Laufe der Zeit in bestimmten Aufgaben an Fähigkeiten verlieren. Zudem können sich ihre Inhaltsmoderation und Themenrestriktionen ändern, was für Nutzer zu Unberechenbarkeiten führt.
Kulturelle Voreingenommenheit: LLMs sind dafür bekannt, menschliche Vorurteile, beispielsweise in Bezug auf Rasse und Geschlecht, zu replizieren.
Problematischer Inhalt: Manchmal generieren LLMs schädliche oder anstößige Inhalte, die den Ruf von Individuen oder Organisationen schädigen können. Auch das Risiko von Urheberrechtsverletzungen und die Generierung von inhaltlich bedenklichem Material ist nicht auszuschließen.

KI in der wissenschaftlichen Schreibarbeit – GPT-4 gleichauf mit menschlichen Forschern

Bekannte LLM

Ein Schlüsselelement von LLMs ist ihre Fähigkeit, Kontext zu berücksichtigen. Das bedeutet, sie können nicht nur einfache Fragen beantworten, sondern auch komplexere Anfragen verstehen und darauf reagieren. Sie können auch kreativ sein, indem sie Geschichten schreiben oder Gedichte verfassen. Die bekanntesten LLM sind derzeit wohl:

LLaMA: LLaMA umfasst eine Reihe von Sprachmodellen mit 7 bis 65 Milliarden Parametern, die auf Billionen von Tokens trainiert wurden. LLaMA-13B zeigte bessere Leistung als GPT-3 (175B), während LLaMA-65B mit führenden Modellen wie Chinchilla-70B und PaLM-540B vergleichbar ist.
Vicunna: Vicunna-13B ist ein Open-Source-Chatbot, der durch Feinabstimmung von LLaMA mit Nutzergesprächen von 70K ShareGPT entwickelt wurde. Es nutzt Techniken wie Gradient Checkpointing und Flash Attention, um Speicherbedarf zu reduzieren, hat aber Einschränkungen bei Logik- oder Mathematikaufgaben.
GPT4all: GPT4all basiert auf LLaMA und arbeitet unter einer nicht-kommerziellen Lizenz. Es nutzt Daten von OpenAI’s GPT-3.5-turbo und hat Versionen mit verschiedenen Parametergrößen, wobei die neueste Version 13 Milliarden Parameter hat.
Dolly: Dolly ist ein leicht modifiziertes Open-Source-Modell mit 6 Milliarden Parametern, das von EleutherAI stammt.
ChatGPT: ChatGPT von OpenAI hat großes Interesse geweckt. Es gibt jedoch Unklarheiten über den Trainingsprozess und die Architektur von ChatGPT. Die Modelle GPT-3.5 und GPT-4 zeigen eine erhebliche Variabilität in Leistung und Verhalten über die Zeit.
Falcon: Die Falcon-Familie umfasst Falcon-40B und Falcon-7B. Falcon-7B und Falcon-40B wurden auf einem Korpus von 1,5 Billionen bzw. 1 Billion Tokens trainiert und nutzen die Multiquery-Aufmerksamkeitstechnik

Über
Letzte Artikel

Rechtsanwalt Jens Ferner (Fachanwalt für IT-Recht & Strafrecht)

Rechtsanwalt bei Anwaltskanzlei Ferner Alsdorf

Rechtsanwalt Jens Ferner ist erfahrener und hochspezialisierter Fachanwalt für Strafrecht sowie Fachanwalt für IT-Recht mit über einem Jahrzehnt Berufspraxis und widmet sich ganz der Tätigkeit als Strafverteidiger und dem IT-Recht - spezialisiert auf Cybercrime, Cybersecurity, Softwarerecht und Managerhaftung. Er ist Lehrbeauftragter für IT-Compliance (FH Aachen), zertifizierter Experte für Krisenkommunikation & Cybersecurity; zudem Autor sowohl in Fachzeitschriften als auch in einem renommierten StPO-Kommentar zum IT-Strafprozessrecht sowie zur EU-Staatsanwaltschaft. Als Softwareentwickler ist er in Python zertifiziert und hat IT-Handbücher geschrieben.

Er beschäftigt sich intensiv im technologischen Bereich mit Fragen der Softwareentwicklung, KI und Robotik - nicht nur als Jurist, sondern eben auch selbst als Entwickler. In diesem Blog werden Inhalte vor allem rund um Robotik bzw. Roboterrecht und ergänzend zum Thema K geteiltI. Es werden Unternehmen im gesamten IT-Recht beraten und vertreten, dies vor allem strategisch und nicht juristisch nach "Schema F".

Letzte Artikel von Rechtsanwalt Jens Ferner (Fachanwalt für IT-Recht & Strafrecht) (Alle anzeigen)

KI-Haftungsrichtlinie 2026: Wie geht es in der KI-Haftung nun weiter? - März 4, 2026
Physical AI - Februar 27, 2026
EU-Maschinenverordnung (Verordnung über sichere Maschinenprodukte 2027) - Januar 1, 2026

Large Language Models (LLM)

Stärken und Schwächen von LLM

Stärken

Schwächen

Bekannte LLM

Veröffentlicht von

Rechtsanwalt Jens Ferner (Fachanwalt für IT-Recht & Strafrecht)