{"id":7065,"date":"2023-10-24T11:15:28","date_gmt":"2023-10-24T09:15:28","guid":{"rendered":"https:\/\/staging.artiquare.com\/anpassung-von-open-source-llms-erforschte-techniken\/"},"modified":"2023-11-24T10:18:41","modified_gmt":"2023-11-24T08:18:41","slug":"anpassung-von-open-source-llms-techniken","status":"publish","type":"post","link":"https:\/\/staging.artiquare.com\/de\/anpassung-von-open-source-llms-techniken\/","title":{"rendered":"Anpassung von Open-Source-LLMs: Adaptionstechniken"},"content":{"rendered":"<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-padding-right:20px;--awb-padding-left:20px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:1372.8px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:1.92%;--awb-margin-bottom-large:20px;--awb-spacing-left-large:1.92%;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:1.92%;--awb-spacing-left-medium:1.92%;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:1.92%;--awb-spacing-left-small:1.92%;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-1\" style=\"--awb-content-alignment:left;\"><div>\n<p>Im letzten Teil unserer Serie haben wir uns mit der <a href=\"https:\/\/staging.artiquare.com\/de\/demokratisierung-der-generativen-ki-open-source-llms-und-artiquare\/\">demokratisierenden Kraft von Large Language Models (LLMs)<\/a> und ihrem Potenzial, die Machtverh\u00e4ltnisse in der KI-Branche neu zu gestalten, besch\u00e4ftigt. Doch wie bei vielen transformativen Technologien bedeutet der generalistische Charakter dieser Modelle, dass sie zwar ein enormes Potenzial haben, aber spezifische Anpassungen an die jeweiligen Bed\u00fcrfnisse erfordern.<\/p>\n<p>Open-Source-LLMs, so leistungsf\u00e4hig sie auch sind, werden oft als Breitbandl\u00f6sungen angeboten. Um ihre Effizienz und Relevanz zu maximieren, m\u00fcssen sie f\u00fcr bestimmte Anwendungen angepasst werden. Dieser Artikel befasst sich mit solchen Anpassungen und beleuchtet Techniken wie Fine-tuning, Prompt-Engineering und die faszinierende Retrieval-Augmented Generation (RAG). Durch diese Erkundung wollen wir den Lesern das Wissen vermitteln, das sie ben\u00f6tigen, um das wahre Potenzial von LLMs in ihrem spezifischen Kontext zu nutzen.<\/p>\n<p>Tauchen Sie mit uns in die Kunst und Wissenschaft der Anpassung von Open-Source-LLMs ein und schaffen Sie die Voraussetzungen f\u00fcr ein breiteres Verst\u00e4ndnis und eine h\u00f6here Wertsch\u00e4tzung der Welt der Open-Source-KI.<\/p>\n<\/div>\n<\/div><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:15px;--awb-margin-bottom:25px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\">Fine-tuning: Jenseits der Fundamente<\/h2><\/div><div class=\"fusion-image-element\" style=\"text-align:center;--awb-margin-top:20px;--awb-margin-bottom:20px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-1 hover-type-none\" style=\"border-radius:8px;\"><img decoding=\"async\" width=\"768\" height=\"211\" alt=\"fine tuning of open-source llms\" title=\"fine-tuning\" src=\"https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/fine-tuning.webp\" data-orig-src=\"https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/fine-tuning.webp\" class=\"lazyload img-responsive wp-image-7055\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27768%27%20height%3D%27211%27%20viewBox%3D%270%200%20768%20211%27%3E%3Crect%20width%3D%27768%27%20height%3D%27211%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/fine-tuning-200x55.webp 200w, https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/fine-tuning-400x110.webp 400w, https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/fine-tuning-600x165.webp 600w, https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/fine-tuning.webp 768w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 768px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-2 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p>In der Welt der LLMs gibt es keine Einheitsgr\u00f6\u00dfe, die f\u00fcr alle passt. Hier kommt die <a href=\"https:\/\/www.analyticsvidhya.com\/blog\/2023\/08\/fine-tuning-large-language-models\/\">Fine-tuning<\/a> ins Spiel, ein Prozess, der ein allgemeines KI-Modell in einen aufgabenspezifischen Experten verwandelt. Im Grunde ist die Fine-tuning vergleichbar mit einem Allgemeinmediziner, der eine Facharztausbildung zum Kardiologen oder Neurologen absolviert &#8211; er verf\u00fcgt \u00fcber die Grundlagen, muss aber sein Fachwissen auf den spezifischen Kontext abstimmen.<\/p>\n<ul>\n<li><strong>Die Grundlage<\/strong>: Die meisten LLMs werden bei ihrer ersten Ausbildung mit gro\u00dfen Mengen an Textdaten konfrontiert, wodurch sie Grammatik, Fakten \u00fcber die Welt und ein gewisses Ma\u00df an logischem Denken lernen k\u00f6nnen. Diese breite Wissensbasis bildet das Fundament.<\/li>\n<\/ul>\n<ul>\n<li><strong>Die Spezialisierung beginnt<\/strong>: Um dieses allgemeine Wissen an eine bestimmte Anwendung anzupassen, wird das Modell zus\u00e4tzlich auf einem engeren, f\u00fcr die Aufgabe relevanten Datensatz trainiert. Um beispielsweise einen Bot f\u00fcr Rechtsassistenten zu entwickeln, k\u00f6nnte ein LLM auf juristische Dokumente und Rechtsprechung abgestimmt werden.<\/li>\n<\/ul>\n<\/div><div class=\"fusion-text fusion-text-3 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p><strong>Varianten des Fine-Tuning<\/strong>:<\/p>\n<ul>\n<li><strong>Vollst\u00e4ndige Fine-tuning<\/strong>: Dies ist die herk\u00f6mmliche Methode, bei der das gesamte Modell, unabh\u00e4ngig von seiner Gr\u00f6\u00dfe, auf neuen Daten trainiert wird. Alle Parameter werden an die jeweilige Aufgabe angepasst. Dies ist zwar effektiv, kann aber rechenintensiv und zeitaufw\u00e4ndig sein, insbesondere bei umfangreichen Modellen wie vielen LLMs.<\/li>\n<li><strong>Parametereffiziente Fine-Tuning (PEFT)<\/strong>: Eine moderne Technik, die darauf abzielt, die gew\u00fcnschte Leistung mit einer geringeren Anzahl von Parametern zu erreichen. Diese Methode ist besonders wichtig, um die Rechenkosten niedrig zu halten, vor allem wenn man mit gro\u00dfen Modellen arbeitet. Wir werden PEFT und seine Feinheiten in einem sp\u00e4teren Artikel dieser Serie n\u00e4her beleuchten.<\/li>\n<\/ul>\n<\/div><div class=\"fusion-text fusion-text-4 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p>Warum sollten Sie sich f\u00fcr Fine-Tuning entscheiden? Denn es nutzt das Wissen, \u00fcber das ein Modell bereits verf\u00fcgt (das anhand umfangreicher Datens\u00e4tze trainiert wurde), und passt es an spezifische Aufgaben an. Diese Technik verk\u00fcrzt die Lernkurve erheblich und stellt sicher, dass das Modell nicht bei Null anf\u00e4ngt, sondern auf einem etablierten Fundament aufbaut. Dar\u00fcber hinaus k\u00f6nnen Unternehmen durch den Einsatz von Varianten wie PEFT eine solide Leistung erzielen, ohne exorbitante Rechenkosten zu verursachen.<\/p>\n<ul>\n<li><strong>Ma\u00dfgeschneiderte L\u00f6sungen<\/strong>: Jedes Unternehmen ist einzigartig, und dank der Fine-tuning k\u00f6nnen KI-L\u00f6sungen diese Einzigartigkeit widerspiegeln.<\/li>\n<li><strong>Wirtschaftlich<\/strong>: Der Aufbau eines LLM von Grund auf ist ressourcenintensiv. Die Fine-tuning ist eine kosteng\u00fcnstige Alternative.<\/li>\n<li><strong>Effizienz<\/strong>: In der sich schnell entwickelnden Welt der KI ist Zeit das A und O. Die Fine-tuning ist schneller als eine umfassende Schulung und bietet eine zeitnahe L\u00f6sung.<\/li>\n<li><strong>Nutzung von vorhandenem Wissen<\/strong>: Wenn Sie mit einem vortrainierten Modell beginnen, fangen Sie nicht bei Null an. Sie bauen auf vorhandenem Fachwissen auf.<\/li>\n<\/ul>\n<\/div><div class=\"fusion-text fusion-text-5 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p><strong>Vorteile der Fine-tuning<\/strong>:<\/p>\n<ul>\n<li><strong>Schnelle Anpassung<\/strong>: Schnelligkeit ist von entscheidender Bedeutung, und die Fine-tuning ist wesentlich schneller als das Training eines Modells von Grund auf.<\/li>\n<li><strong>Kosteneffizienz<\/strong>: Es ist wirtschaftlich kl\u00fcger, ein bereits bestehendes Modell anzupassen, als eines von Grund auf neu zu entwickeln.<\/li>\n<li><strong>Vielseitigkeit<\/strong>: Von Bots f\u00fcr den Kundenservice bis hin zu pr\u00e4diktiven Analysetools kann ein Basismodell unz\u00e4hlige Spezialanwendungen hervorbringen.<\/li>\n<\/ul>\n<p><strong>Herausforderungen der Fine-tuning<\/strong>:<\/p>\n<ul>\n<li><strong>Qualit\u00e4t ist wichtig<\/strong>: Der Output ist nur so gut wie der Input. Verzerrte oder fehlerhafte Daten f\u00fcr die Fine-tuning f\u00fchren zu unvollkommenen Ergebnissen.<\/li>\n<li><strong>Balanceakt<\/strong>: Es besteht die Gefahr, dass das Modell zu sehr spezialisiert wird und dadurch ein Teil seines Allgemeinwissens verloren geht.<\/li>\n<\/ul>\n<p>Mit einem Verst\u00e4ndnis f\u00fcr die Fine-tuning k\u00f6nnen Unternehmen die KI-Landschaft strategischer navigieren und den richtigen Ansatz f\u00fcr ihre spezifischen Bed\u00fcrfnisse und Herausforderungen w\u00e4hlen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:15px;--awb-margin-bottom:25px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\">Prompt-Technik: Gestaltung von Fragen f\u00fcr intelligentere KI<\/h2><\/div><div class=\"fusion-image-element\" style=\"text-align:center;--awb-margin-top:20px;--awb-margin-bottom:20px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-2 hover-type-none\" style=\"border-radius:8px;\"><img decoding=\"async\" width=\"798\" height=\"451\" alt=\"prompt engineering\" title=\"prompt-engineering-1\" src=\"https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/prompt-engineering-1.webp\" data-orig-src=\"https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/prompt-engineering-1.webp\" class=\"lazyload img-responsive wp-image-7050\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27798%27%20height%3D%27451%27%20viewBox%3D%270%200%20798%20451%27%3E%3Crect%20width%3D%27798%27%20height%3D%27451%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/prompt-engineering-1-200x113.webp 200w, https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/prompt-engineering-1-400x226.webp 400w, https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/prompt-engineering-1-600x339.webp 600w, https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/prompt-engineering-1.webp 798w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 798px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-6 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p>Da KI in unserer Welt eine immer gr\u00f6\u00dfere Rolle spielt, kommt es nicht nur darauf an, ein intelligentes Modell zu haben, sondern auch zu wissen, wie man ihm die richtigen Fragen stellt. Hier kommt das <a href=\"https:\/\/en.wikipedia.org\/wiki\/Prompt_engineering\">Prompt-Engineering<\/a> ins Spiel.<\/p>\n<p><strong>Einf\u00fchrung in das Prompt Engineering:<\/strong><br \/>\nAuch wenn es sich kompliziert anh\u00f6rt, ist Prompt-Engineering im Wesentlichen die Kunst, Eingaben oder &#8222;Prompts&#8220; so zu gestalten, dass die gew\u00fcnschten Ergebnisse eines Modells erzielt werden. Stellen Sie sich vor, Sie stellen eine Frage auf verschiedene Arten, um die genaueste Antwort zu erhalten. Anstelle der Frage &#8222;Was ist die Hauptstadt Frankreichs?&#8220; k\u00f6nnte eine Frage lauten: &#8222;Welche Stadt ist der offizielle Sitz der franz\u00f6sischen Regierung?&#8220;<\/p>\n<p><strong>Die Macht der Prompts:<\/strong><br \/>\nDurch die Umstrukturierung unserer Fragen k\u00f6nnen wir dem Modell pr\u00e4zisere oder nuanciertere Antworten entlocken. Dazu muss das Modell nicht unbedingt neu trainiert werden. Stattdessen geht es darum, das bestehende Modell zu besseren Schlussfolgerungen zu f\u00fchren, indem die Frage besser formuliert wird. In vielen F\u00e4llen kann die richtige Aufforderung den Unterschied zwischen einer allgemeinen Antwort und einer differenzierten, detaillierten Antwort ausmachen.<\/p>\n<p><strong>Herausforderungen und Beschr\u00e4nkungen:<\/strong><br \/>\nDas Prompt-Engineering ist jedoch nicht ohne Herausforderungen. Das Finden des richtigen Prompts ist oft mit Versuch und Irrtum verbunden, und w\u00e4hrend ein Prompt bei einem Modell gut funktioniert, ist er bei einem anderen vielleicht nicht so effektiv. Au\u00dferdem kann ein \u00fcberm\u00e4\u00dfiger R\u00fcckgriff auf diese Technik zu einer \u00dcberanpassung f\u00fchren, bei der das Modell zu sehr auf bestimmte Aufforderungen zugeschnitten ist und seine Verallgemeinerungsf\u00e4higkeit einb\u00fc\u00dft.<\/p>\n<p><strong>Warum sollten Sie Prompt Engineering nutzen?<\/strong><br \/>\nTrotz seiner Herausforderungen nimmt das Prompt-Engineering einen besonderen Platz in der Welt der KI-Anpassung ein. Dies ist eine kosteneffiziente Methode, um mehr aus den Modellen herauszuholen, ohne dass eine umfangreiche Umschulung erforderlich ist. In Szenarien, in denen Rechenressourcen oder Daten begrenzt sind, bietet das Prompt-Engineering eine praktikable Alternative, um das volle Potenzial eines LLM auszusch\u00f6pfen.<\/p>\n<\/div><div class=\"fusion-text fusion-text-7 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><h3>Fortgeschrittene Strategien im Prompt Engineering<\/h3>\n<p><strong>1. Zero-Shot-, Few-Shot- und Many-Shot-Lernen<\/strong>:<\/p>\n<ul>\n<li><strong>Zero-Shot-Learning<\/strong>: Dies bezieht sich auf die F\u00e4higkeit eines LLM, Aufgaben auszuf\u00fchren, f\u00fcr die es nicht ausdr\u00fccklich trainiert wurde. Nehmen wir an, Sie haben ein Modell auf eine F\u00fclle von Allgemeinwissen trainiert, aber nie speziell auf die Identifizierung seltener Vogelarten. Wird dem Modell jedoch eine Beschreibung eines seltenen Vogels vorgelegt, kann es diesen aufgrund seiner umfassenden Kenntnisse und der Korrelation mit bekannten Daten korrekt identifizieren.<\/li>\n<li><strong>Few-Shot-Learning<\/strong>: Hier erh\u00e4lt der LLM einige Beispiele, um eine neue Aufgabe zu verstehen. Indem gezeigt wird, wie \u00e4hnliche Aufgaben angegangen wurden, erh\u00e4lt das Modell einen &#8222;Hinweis&#8220; und ist besser in der Lage, neue, verwandte Aufgaben anzugehen. Stellen Sie sich vor, Sie m\u00f6chten mit Ihrem Modell Rezepte erstellen. Sie geben ihm eine Handvoll Beispiele wie &#8222;Zutat: Apfel, Gericht: Kuchen&#8220; und fordern es dann mit &#8222;Zutat: Huhn&#8220; auf. Das Modell k\u00f6nnte dann ein Gericht mit Huhn zubereiten, nachdem es die Aufgabe anhand der wenigen Beispiele verstanden hat.<\/li>\n<li><strong>Many-Shot Learning<\/strong>: Wie der Name schon sagt, geht es darum, dem LLM zahlreiche Beispiele zu geben. Wenn Sie Zusammenfassungen von technischen Forschungsarbeiten erhalten m\u00f6chten, k\u00f6nnen Sie dem Modell Dutzende von Beispielen f\u00fcr Forschungsarbeiten und deren kurze Zusammenfassungen vorlegen. Bei einer neuen Arbeit wird das Modell besser in der Lage sein, eine Zusammenfassung zu erstellen, die denselben Stil und dieselbe K\u00fcrze aufweist wie die Beispiele.<\/li>\n<\/ul>\n<p><strong>2. Ansatz der Gedankenkette (Chain-of-Thoughts)<\/strong>:<\/p>\n<p>Manchmal reicht eine einzige Aufforderung nicht aus. Der Ansatz der &#8222;Chain of Thoughts&#8220; beinhaltet die Erstellung einer Reihe von Aufforderungen, wobei jede nachfolgende Abfrage auf der vorherigen aufbaut. Dies ist vergleichbar mit einem Gespr\u00e4ch, bei dem die Informationen nach und nach aufgeschichtet werden, so dass komplizierte Details herausgefiltert werden k\u00f6nnen oder eine tiefer gehende Erforschung eines Themas m\u00f6glich ist. Denken Sie an eine detaillierte Erkl\u00e4rung eines komplexen Themas wie der Quantenverschr\u00e4nkung. Die erste Aufforderung k\u00f6nnte eine einfache Frage sein: &#8222;Was ist Quantenverschr\u00e4nkung?&#8220; Ausgehend von der Antwort des Modells k\u00f6nnte eine Folgeuntersuchung tiefer gehen und fragen: &#8222;Wie korreliert das mit der Quanten\u00fcberlagerung?&#8220; Diese sequentielle Aufforderung kann zu einem umfassenderen, vielschichtigen Verst\u00e4ndnis f\u00fchren.<\/p>\n<p><strong>Nutzung fortgeschrittener Prompting-Techniken<\/strong>:<\/p>\n<p>Die Anwendung dieser fortschrittlichen Strategien kann einen entscheidenden Unterschied machen. Sie bieten einen dynamischen Ansatz, um die F\u00e4higkeiten von LLMs zu nutzen und gew\u00e4hrleisten eine ganzheitlichere, nuanciertere Reaktion des Modells. Dies ist besonders wichtig in Szenarien, in denen eine Fine-tuning nicht m\u00f6glich ist oder in denen eine eher explorative, organische Interaktion mit dem Modell gew\u00fcnscht wird.<\/p>\n<\/div><div class=\"fusion-text fusion-text-8 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p><strong>Vorteile von Prompt Engineering<\/strong>:<\/p>\n<ul>\n<li><strong>Flexibilit\u00e4t<\/strong>: Prompting bietet einen dynamischen Ansatz, um die gew\u00fcnschten Ergebnisse von Modellen zu erhalten, ohne dass ein erneutes Training erforderlich ist. Dies ist besonders n\u00fctzlich, wenn der Benutzer verschiedene Antworten auf der Grundlage unterschiedlicher Szenarien ben\u00f6tigt.<\/li>\n<li><strong>Schnelle Anpassung<\/strong>: Beim Lernen mit wenigen oder vielen Sch\u00fcssen k\u00f6nnen sich die Modelle schnell an neue Aufgaben anpassen, so dass es einfacher ist, das Verhalten ohne einen umfassenden Feinabstimmungsprozess zu \u00e4ndern.<\/li>\n<li><strong>Ressourceneffizienz<\/strong>: Im Vergleich zum Nachtrainieren von Modellen ist das Prompt-Engineering oft rechnerisch effizienter. Es erm\u00f6glicht schnelle Anpassungen und \u00c4nderungen ohne gro\u00dfen Ressourcenaufwand.<\/li>\n<li><strong>Iteratives Lernen<\/strong>: Der Chain-of-Thoughts-Ansatz erleichtert ein tieferes Verst\u00e4ndnis, indem er komplexe Fragen iterativ in einfachere, aufeinander folgende Abfragen zerlegt, die dem Modell helfen, eine differenzierte Antwort zu finden.<\/li>\n<\/ul>\n<p><strong>Herausforderungen der Prompt Engineering<\/strong>:<\/p>\n<ul>\n<li><strong>Konsistenz<\/strong>: Es kann eine Herausforderung sein, f\u00fcr unterschiedliche Eingaben konsistente Ergebnisse zu erzielen. Ein und dieselbe Aufforderung kann manchmal zu unterschiedlichen Antworten f\u00fchren, wenn die Eingabeformulierung leicht ver\u00e4ndert wird.<\/li>\n<li><strong>Skalierbarkeit<\/strong>: W\u00e4hrend die Eingabeaufforderung f\u00fcr einzelne Aufgaben oder Abfragen gut funktioniert, kann die Skalierung f\u00fcr gro\u00dfe Datens\u00e4tze oder umfassende Aufgaben eine Herausforderung darstellen, insbesondere wenn eine einheitliche Ausgabe f\u00fcr alle Eingabeaufforderungen erforderlich ist.<\/li>\n<li><strong>Fachwissen erforderlich<\/strong>: Die Erstellung effektiver Prompts, insbesondere f\u00fcr fortgeschrittene Strategien wie Chain of Thoughts, erfordert ein tiefes Verst\u00e4ndnis des Modells und der jeweiligen Aufgabe.<\/li>\n<li><strong>\u00dcberm\u00e4\u00dfiges Vertrauen<\/strong>: Wenn man sich ausschlie\u00dflich auf das Prompting verl\u00e4sst, kann es passieren, dass man die potenziellen Vorteile anderer Techniken wie der Fine-tuning verpasst, vor allem, wenn die Aufgabe umfangreiche \u00c4nderungen im Modellverhalten erfordert.<\/li>\n<\/ul>\n<\/div><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:15px;--awb-margin-bottom:25px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\">Retrieval-Augmented Generation (RAG)<\/h2><\/div><div class=\"fusion-image-element\" style=\"text-align:center;--awb-margin-top:20px;--awb-margin-bottom:20px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-3 hover-type-none\" style=\"border-radius:8px;\"><img decoding=\"async\" width=\"768\" height=\"430\" alt=\"retrieval augemneted generation rag\" title=\"retrieval-augemneted-generation\" src=\"https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation.webp\" data-orig-src=\"https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation.webp\" class=\"lazyload img-responsive wp-image-7060\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27768%27%20height%3D%27430%27%20viewBox%3D%270%200%20768%20430%27%3E%3Crect%20width%3D%27768%27%20height%3D%27430%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation-200x112.webp 200w, https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation-400x224.webp 400w, https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation-600x336.webp 600w, https:\/\/staging.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation.webp 768w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 768px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-9 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p><strong>Einf\u00fchrung in die RAG<\/strong>:<\/p>\n<p><a href=\"https:\/\/research.ibm.com\/blog\/retrieval-augmented-generation-RAG\">Retrieval-Augmented Generation (RAG)<\/a> kombiniert das Beste aus Retrieval-basierten und generativen Methoden, um Fragen zu beantworten. Im Kern nutzt RAG externe Wissensquellen, oft gro\u00dfe Datenbanken oder Korpora, um eine Antwort zu generieren. Wenn eine Frage gestellt wird, ruft das Modell zun\u00e4chst relevante Dokumentenpassagen aus seiner Datenbank ab und formuliert dann eine koh\u00e4rente und kontextbezogene Antwort unter Verwendung dieser Passagen.<\/p>\n<p><strong>Wie die RAG funktioniert<\/strong>:<\/p>\n<ol>\n<li><strong>Abfrage-Phase<\/strong>: Wenn eine Anfrage gestellt wird, identifiziert RAG zun\u00e4chst relevante Passagen oder Dokumente aus einem umfangreichen Korpus, die Kontext oder Erkenntnisse zur Beantwortung der Anfrage liefern k\u00f6nnten.<\/li>\n<li><strong>Generierungsphase<\/strong>: Unter Verwendung der abgerufenen Dokumente als Kontext generiert das Modell dann eine koh\u00e4rente Antwort. Dieses Verfahren stellt sicher, dass die Antworten nicht nur auf dem vorab trainierten Wissen des Modells basieren, sondern auch auf den neuesten und relevantesten Daten aus externen Quellen.<\/li>\n<\/ol>\n<p><strong>Beispiele<\/strong>:<\/p>\n<ul>\n<li><strong>Faktenbasierte Fragen<\/strong>: Wenn jemand fragt: &#8222;Was sind die Hauptursachen f\u00fcr das Nordlicht?&#8220;, k\u00f6nnte die RAG wissenschaftliche Artikel oder vertrauensw\u00fcrdige Datenbanken \u00fcber atmosph\u00e4rische Ph\u00e4nomene abrufen, um eine detaillierte und genaue Antwort zu geben.<\/li>\n<li><strong>Aktualisierungen von Ereignissen<\/strong>: Auf Fragen wie &#8222;Was waren die Ergebnisse der j\u00fcngsten Klimakonferenz?&#8220; k\u00f6nnte die RAG Informationen aus aktuellen Nachrichtenartikeln oder offiziellen Zusammenfassungen von Konferenzen entnehmen, um eine aktuelle Antwort zu geben.<\/li>\n<\/ul>\n<\/div><div class=\"fusion-text fusion-text-10 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p><strong>Vorteile der RAG<\/strong>:<\/p>\n<ol>\n<li><strong>Datengesteuerte Antworten<\/strong>: Der Ansatz von RAG stellt sicher, dass die Antworten nicht nur auf den vortrainierten Daten des Modells basieren, sondern auch auf aktuellen und kontextrelevanten Informationen in Echtzeit.<\/li>\n<li><strong>Ausgewogener Ansatz<\/strong>: Durch die Kombination von Abrufen und Generieren schafft RAG ein Gleichgewicht zwischen Genauigkeit (durch Abrufen von Sachdaten) und Gel\u00e4ufigkeit (durch Generieren koh\u00e4renter Antworten).<\/li>\n<li><strong>Skalierbarkeit<\/strong>: Mit einer externen Datenbank kann das System st\u00e4ndig mit neuen Informationen aktualisiert werden, so dass das Modell im Laufe der Zeit relevant bleibt, ohne dass eine st\u00e4ndige Nachschulung erforderlich ist.<\/li>\n<\/ol>\n<p><strong>Herausforderungen der RAG<\/strong>:<\/p>\n<ol>\n<li><strong>Abh\u00e4ngigkeit von externen Daten<\/strong>: Die Genauigkeit und Relevanz der Antworten des Modells h\u00e4ngen stark von der Qualit\u00e4t der externen Datenbank ab.<\/li>\n<li><strong>Komplexit\u00e4t<\/strong>: Die Implementierung von RAG erfordert die Verwaltung von Abruf- und Generierungsprozessen, was die Komplexit\u00e4t des Systems erh\u00f6hen kann.<\/li>\n<li><strong>Latenzzeit<\/strong>: Der zweistufige Prozess, insbesondere beim Zugriff auf gro\u00dfe Datenbanken, kann zu einer Latenz bei der Generierung von Antworten f\u00fchren, was f\u00fcr Echtzeitanwendungen problematisch sein kann.<\/li>\n<\/ol>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:30px;--awb-margin-bottom:20px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\">Die Wahl der richtigen Technik f\u00fcr Ihre Bed\u00fcrfnisse<\/h2><\/div><div class=\"fusion-text fusion-text-11 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p>Wir haben zwar verschiedene Techniken zur Anpassung von Open-Source-LLMs untersucht, aber die Frage, die sich oft stellt, ist: &#8222;Welche Technik ist die richtige f\u00fcr mein Projekt?&#8220; Die Antwort h\u00e4ngt weitgehend von Ihren spezifischen Anforderungen ab:<\/p>\n<ul>\n<li><strong>Fine-tuning<\/strong>: Am besten geeignet f\u00fcr Projekte, die einen bestimmten Datensatz zur Verf\u00fcgung haben und eine ma\u00dfgeschneiderte Modellleistung anstreben. Diese Methode ist besonders vorteilhaft, wenn die Leistung eines vortrainierten LLM f\u00fcr die Aufgabe nicht zufriedenstellend ist.<\/li>\n<li><strong>Prompt Engineering<\/strong>: Eine gute Wahl f\u00fcr Aufgaben, die einen allgemeineren Ansatz erfordern, insbesondere wenn die verf\u00fcgbaren Daten f\u00fcr das Training knapp sind. Wenn Sie schnell Ergebnisse erzielen wollen, ohne den Aufwand einer Modellschulung zu betreiben, kann Prompting ein wirkungsvolles Instrument sein.<\/li>\n<li><strong>Retrieval-Augmented Generation (RAG)<\/strong>: Optimal f\u00fcr Projekte, die eine Kombination aus Wissensabfrage und -generierung erfordern. Wenn Ihre Anwendung die Beschaffung von Informationen aus gro\u00dfen Datenbest\u00e4nden oder Dokumenten und die anschlie\u00dfende Generierung einer zusammenh\u00e4ngenden Antwort erfordert, ist RAG die richtige Technik f\u00fcr Sie.<\/li>\n<\/ul>\n<p>Die obigen Angaben sind jedoch nur eine grundlegende Richtlinie. Die Besonderheiten Ihres Projekts, die Datenverf\u00fcgbarkeit, die Rechenressourcen und die gew\u00fcnschten Ergebnisse spielen bei der Entscheidungsfindung eine wichtige Rolle. Bleiben Sie dran f\u00fcr unsere n\u00e4chsten Artikel, in denen wir auf die Feinheiten der einzelnen Methoden eingehen und Ihnen helfen, noch fundiertere Entscheidungen zu treffen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:30px;--awb-margin-bottom:20px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\">Zusammenfassung<\/h2><\/div><div class=\"fusion-text fusion-text-12 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p>Da sich die KI-Landschaft st\u00e4ndig weiterentwickelt, m\u00fcssen sich auch die Techniken, mit denen wir die Leistung von gro\u00dfen Sprachmodellen nutzen k\u00f6nnen, weiterentwickeln. Fine-tuning, zeitnahes Engineering und RAG bieten jeweils einzigartige Vorteile, die auf spezifische Herausforderungen und Ziele abgestimmt sind. Ob es sich nun um die pr\u00e4zise Kalibrierung eines Modells f\u00fcr bestimmte Aufgaben durch Fine-tuning, die Vielseitigkeit und Anpassungsf\u00e4higkeit, die das Prompt-Engineering bietet, oder die Dynamik und reale Anwendbarkeit, die durch RAG erreicht wird, handelt, diese Techniken stellen die n\u00e4chste Grenze der LLM-Anpassung dar.<\/p>\n<p>Da Open-Source-LLMs immer beliebter werden, ist das Verst\u00e4ndnis dieser Techniken f\u00fcr Unternehmen und Entwickler, die auf der Welle der KI-Demokratisierung mitreiten wollen, von entscheidender Bedeutung. Es geht nicht nur um den Zugang zu leistungsstarken Modellen, sondern auch darum, sie effektiv auf reale Anwendungen zuzuschneiden.<\/p>\n<p>In den kommenden Artikeln werden wir uns n\u00e4her mit den Nuancen dieser Techniken, ihrer Effizienz und ihren Auswirkungen auf die Nachhaltigkeit befassen. Das Zeitalter der barrierefreien KI ist angebrochen, und die Werkzeuge, um ihr Potenzial zu nutzen, liegen direkt vor unserer Nase. Begleiten Sie uns auf dieser Reise, auf der wir erforschen, anpassen und erneuern.<\/p>\n<\/div><\/div><\/div><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"","protected":false},"author":1,"featured_media":7053,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[],"tags":[201,204,203,202],"class_list":["post-7065","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","tag-feinabstimmung","tag-ki-demokratisierung","tag-ki-zuganglichkeit","tag-open-source-ki"],"_links":{"self":[{"href":"https:\/\/staging.artiquare.com\/de\/wp-json\/wp\/v2\/posts\/7065","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/staging.artiquare.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/staging.artiquare.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/staging.artiquare.com\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/staging.artiquare.com\/de\/wp-json\/wp\/v2\/comments?post=7065"}],"version-history":[{"count":2,"href":"https:\/\/staging.artiquare.com\/de\/wp-json\/wp\/v2\/posts\/7065\/revisions"}],"predecessor-version":[{"id":7819,"href":"https:\/\/staging.artiquare.com\/de\/wp-json\/wp\/v2\/posts\/7065\/revisions\/7819"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/staging.artiquare.com\/de\/wp-json\/wp\/v2\/media\/7053"}],"wp:attachment":[{"href":"https:\/\/staging.artiquare.com\/de\/wp-json\/wp\/v2\/media?parent=7065"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/staging.artiquare.com\/de\/wp-json\/wp\/v2\/categories?post=7065"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/staging.artiquare.com\/de\/wp-json\/wp\/v2\/tags?post=7065"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}