In unserem nächsten codemanufaktur-liest-Vortrag wird es diesmal sowohl technisch als auch philosophisch – und auf jeden Fall unterhaltsam! Denn unsere Data-Science-Experten nehmen sich der existenziellen Frage an, ob Large Language Models in ihrem Wesen deterministisch sind.
Worum geht`s bei unserem Vortrag?
Sind die Ergebnisse, die Large Language Models liefern, theoretisch eindeutig vorhersehbar – oder bleibt hier immer Raum für Spekulation? Unsere Data-Science-Experten Dr. Gregor Endler und Thomas Janu werden im kommenden Vortrag unserer codemanufaktur-liest-Reihe eine Antwort darauf finden.
Die Ausgangslage: Neuronale Netze lassen sich nach Abschluss ihres Trainings durch unveränderliche mathematische Formeln beschreiben und gelten damit eigentlich als deterministisch. Auch Large Language Models, deren übliche Nutzererfahrung oft ein anderes Verhalten suggeriert, sollten durch ihre Parameter im Kern regelgebunden sein. Soweit zumindest die Theorie.
Doch in der Praxis zeigt sich ein anderes Bild: So agieren z.B. die OpenAI-Modelle selbst bei festgelegtem Seed und einer Temperatur von 0 nicht vollständig deterministisch. Aktuelle wissenschaftliche Veröffentlichungen deuten darauf hin, dass dies keine Ausnahme, sondern eine grundlegende Eigenschaft neuronaler Netze ist.
In unserem Vortrag beleuchten wir diese aktuellen Forschungsergebnisse, erklären mögliche Ursachen für das nicht-deterministische Verhalten, erläutern die Konsequenzen für die praktische Anwendung – und zeigen auf, wie ihr dieses Wissen sinnvoll für euch nutzen könnt.
Agenda:
- 17:30 Uhr Einlass (5. Stock)
- 17:45 Uhr Begrüßung
- 18:00 Uhr Vortrag
- 18:30 Uhr Offene Diskussionsrunde
- 19:00 Uhr Gemeinsames Grillen
Grillen
Nach dem Vortrag könnt ihr in lockerer Atmosphäre unsere Mitarbeiterinnen und Mitarbeiter persönlich kennenlernen – wir grillen und laden euch auf Bratwürste, vegane Alternativen und das eine oder andere Feierabend-Getränk ein. Bei gutem Wetter gerne auf unserer Dachterrasse!
Eingeladen sind alle Interessierten und fachlich Versierten – vom angehenden IT-Azubi über Studierende bis zu erfahrenen Entwicklerinnen, Entwicklern und Data Scientists.
Wir freuen uns auf euch!