N · NE · E · SE · S · SW · W · NW
← Magazin 14. Mai 2026
Web3D · Mai 2026

glTF 2.0 seit 2017: Wie das Khronos-Web-3D-Format zur Welt-Klassik wurde

Im Juni 2017 veröffentlichte die Khronos Group die Version 2.0 des glTF-Formats. Was als „JPEG für 3D" konzipiert war, ist heute De-facto-Standard für Web-3D, AR-Anwendungen, Konfiguratoren und produktbegleitende Visualisierung. Eine Bestandsaufnahme zur Reifung eines Austausch-Formats, das ohne kommerziellen Eigentümer in einem Jahrzehnt zur Welt-Klassik wurde.

Die Geschichte der 3D-Austauschformate ist eine Geschichte gescheiterter oder halbgescheiterter Standardisierungsversuche. VRML 1.0 wurde 1995 als Versuch eines Web-3D-Formats verabschiedet, VRML 97 folgte als ISO-Standard, X3D als Nachfolger seit 2004 — alle blieben Nischen-Lösungen, die in keiner ernsthaften produktiven Pipeline ankommen sollten. FBX, ursprünglich von Kaydara und seit dem Autodesk-Kauf 2006 proprietär, wurde zum dominanten Austauschformat zwischen 3D-Programmen, blieb aber für das Web ungeeignet: zu schwer, zu komplex, ohne offene Spezifikation in der heutigen Form. COLLADA, ein offener XML-basierter Versuch der Khronos Group aus den späten 2000er Jahren, scheiterte an Komplexität und uneinheitlicher Implementierung.

In dieses Vakuum trat 2015 glTF, ausgesprochen wie „Gel-T-F”, mit dem programmatischen Anspruch, „JPEG für 3D” zu sein. Die Khronos Group, ein Konsortium aus über 100 Mitgliedsunternehmen, hatte das Format als JSON-basierten Container für 3D-Szenen entworfen, der direkt von WebGL-, Vulkan- oder OpenGL-Anwendungen geladen werden kann, ohne aufwendige Konvertierungsschritte. Version 1.0 erschien im Oktober 2015 und blieb noch begrenzt in der Verbreitung. Die Zäsur kam mit Version 2.0 im Juni 2017.

Was glTF 2.0 änderte

Die zweite Version brachte drei zentrale Verschiebungen. Erstens: PBR-Materialien. Das Format spezifiziert ein Metallic-Roughness-Workflow nach dem Disney-PBR-Modell als Default, mit Erweiterungspunkten für Specular-Glossiness, Anisotropie, Clearcoat, Sheen, Transmission und Volume. Wer eine Szene aus Blender, 3ds Max oder Cinema 4D exportiert, bekommt damit ein Material-System, das in jeder konformen Render-Engine ähnlich aussieht. Zweitens: ein binäres Container-Format (.glb), das Geometrie, Materialien und Texturen in einer einzigen Datei bündelt, ohne die Notwendigkeit, Hilfsdateien parallel zu pflegen. Drittens: eine klare, vergleichsweise schlanke Spezifikation, die im Vergleich zu COLLADA oder FBX erheblich einfacher zu implementieren ist.

Die Folge war eine schnelle Adoption. Three.js, die seit 2010 von Ricardo Cabello entwickelte JavaScript-Bibliothek für WebGL, baute den glTF-Loader zum praktischen Default-Importer aus. Babylon.js, die Microsoft-finanzierte Konkurrenz-Engine, ebenso. Adobe nahm glTF in Substance Painter, Substance Designer und Dimension auf. Microsoft baute den Format-Support in Paint 3D, später in den Office-Produkten und in die HoloLens-Pipeline ein. Apple unterstützt glTF in seiner ARKit-Pipeline neben dem hauseigenen USDZ-Format, das selbst auf USD aufbaut. Sketchfab, die seit 2012 betriebene 3D-Hosting-Plattform mit Sitz in Paris, stellt glTF als primären Lade- und Download-Format zur Verfügung.

Die DACH-Anwendungslandschaft

In der DACH-Region zeigt sich die Reichweite des Formats vor allem in vier Bereichen. Erstens: E-Commerce-Konfiguratoren. Möbelhersteller, Automobil-Konfiguratoren, Industriegüter-Anbieter setzen seit der zweiten Hälfte der 2010er Jahre verstärkt auf 3D-Produktvisualisierung direkt im Browser. Volkswagen, Audi und BMW haben Konfiguratoren mit Browser-3D-Komponenten, die ausnahmslos auf glTF-basierten Asset-Pipelines aufsetzen. Zweitens: AR-Anwendungen im Handel. Wer auf einer Möbelhandel-Plattform ein Sofa per Smartphone in den eigenen Raum projizieren will, lädt ein glTF- oder USDZ-Asset. Drittens: Bildung und Wissenschaft. Anatomie-Lehrbücher, technische Lehrmodelle und Museumsanwendungen nutzen glTF, weil das Format ohne Plugin im Browser läuft. Viertens: Architektur-Präsentation. Während die zentrale Pipeline in Architekturbüros weiterhin auf BIM-Formate wie IFC oder Revit-internen RVT setzt, ist glTF das Format für die öffentliche Präsentation von Projekten, eingebettet in Webseiten oder Konfigurationsplattformen.

Khronos Group und das Konsortium-Modell

Anders als ein Format, das einem einzelnen Hersteller gehört, wird glTF von der Khronos Group gepflegt. Das Konsortium, das auch OpenGL, OpenGL ES, Vulkan, WebGL, OpenXR, SYCL und SPIR-V verwaltet, arbeitet nach einem Membership-Modell mit Stimmrechten und einem Working-Group-Prozess. Erweiterungen zum Format werden über einen offenen Prozess als Khronos-Extensions oder Vendor-Extensions standardisiert. Die KHR_materials_*-Familie, KHR_lights_punctual, KHR_animation_pointer und ähnliche Erweiterungen sind über Jahre dokumentiert worden und werden von Implementierungen unterschiedlich umfangreich unterstützt.

Dass die Spezifikation öffentlich auf GitHub gepflegt wird, hat eine niedrigschwellige Beteiligung ermöglicht. Implementierungs-Hinweise, Testdateien und Referenz-Implementierungen sind frei verfügbar. Für die DACH-Region heißt das, dass kleine Unternehmen und Open-Source-Projekte ohne Lizenz- oder Membership-Hürde Implementierungen bauen können — eine Bedingung, die etwa Three.js oder die zahllosen Engine-Integrationen erst möglich macht.

Das Verhältnis zu USD

Pixar hatte 2016 das Universal Scene Description Format als Open Source veröffentlicht. USD und glTF sind in der öffentlichen Wahrnehmung manchmal als Konkurrenten dargestellt worden, sind technisch jedoch komplementär. USD ist auf große, komplexe Szenen mit Multi-Departement-Editierung in Spielfilm-Pipelines optimiert, mit umfangreichem Komponenten-System, Layer-Modell und Composition-Arcs. glTF ist auf möglichst kompakte Auslieferung von Szenen optimiert, die in Echtzeit-Engines geladen werden sollen. Es gibt produktive Pipelines, die USD als interne Repräsentation und glTF als Auslieferungsformat verwenden.

Apple hat mit USDZ eine ZIP-komprimierte USD-Variante für AR Quick Look spezifiziert. In der Praxis bedeutet das, dass DACH-Unternehmen, die auf iOS-Geräten AR-Erlebnisse anbieten wollen, Assets häufig in beiden Formaten ausliefern: glTF für Browser-3D und Android-AR, USDZ für iOS-AR Quick Look. Konvertierungs-Tools zwischen beiden Formaten sind verfügbar, mit unterschiedlicher Qualität bei Material- und Animations-Erhaltung.

WebGL, WebGPU und der Auslieferungs-Stack

glTF lebt im Web-Browser. Die zugrundeliegende Render-API, WebGL, ist seit 2011 in allen großen Browsern verfügbar; WebGL 2.0 seit 2017. Mit WebGPU, der nächsten Generation der Browser-Grafik-API, die seit April 2023 in Chromium-basierten Browsern stabil ist und seit 2025 in Safari und Firefox folgt, kommt eine deutlich modernere Schnittstelle, die compute-shader-fähig ist und an Vulkan und Metal angelehnt ist. glTF bleibt das passende Asset-Format für diesen Stack; die Loader müssen lediglich auf WebGPU-Pipelines portiert werden.

Three.js und Babylon.js, die beiden führenden Browser-3D-Engines, haben WebGPU-Backends seit 2023 in stabiler Form. Für DACH-Studios, die produktive Browser-3D-Anwendungen bauen, ist das eine Verschiebung der Leistungsgrenzen, die in den kommenden Jahren sichtbar werden wird. Komplexere Geometrie, mehr Lichtquellen, KI-gestützte Inferenz im Browser werden möglich, ohne dass die Asset-Pipeline angefasst werden müsste.

Werkzeuge und Pipelines

Wer in DACH heute glTF produziert, hat eine breite Werkzeugauswahl. Blender exportiert nativ ab Version 2.80, mit kontinuierlicher Verbesserung der Material- und Animations-Erhaltung. 3ds Max und Maya verfügen über Plugins, die teilweise von Autodesk, teilweise von Drittanbietern gepflegt werden. Cinema 4D unterstützt glTF nativ seit den 2020er Versionen. Substance Painter exportiert glTF mit eingebetteten PBR-Texturen, was das Format-Versprechen — gleich aussehendes Material über Engines hinweg — am unmittelbarsten erlebbar macht. Houdini, Modo und ZBrush haben jeweils eigene Wege, glTF zu exportieren.

Auf der Optimierungsseite sind Werkzeuge wie gltfpack, gltf-transform und die Khronos-eigene glTF-Validator-Toolchain zentral. Kompression über Draco (Google, seit 2017) und Meshopt (zlib-Lizenz von Arseny Kapoulkine) reduziert Asset-Größen um Faktoren, was für Browser- und mobile Auslieferung entscheidend ist. KTX2, ein GPU-kompressionsfreundliches Textur-Format aus der Khronos-Familie, ergänzt die Pipeline.

Die offene Frage: 3D-Standard im Browser-Konsens

Ein Format ist nur so verbreitet wie die Pipelines, die es schreiben und lesen. glTF hat in den letzten Jahren eine Position erreicht, in der jede ernsthafte 3D-Software einen Export- und Import-Pfad pflegen muss. Die Frage ist, ob das Format in den kommenden Jahren weiter die Default-Position behält oder ob USDZ aus dem Apple-Ökosystem stärkere Konvergenzkraft entfaltet. Aktuell deuten die Marktbewegungen darauf hin, dass beide Formate parallel bleiben werden.

Für die DACH-Web-3D-Branche, die in den vergangenen Jahren von einer Nische zu einem ernst zu nehmenden Geschäftsbereich für Konfiguratoren, AR-Anwendungen und produktbegleitende Visualisierung gewachsen ist, ist glTF die Grundlage. Berlin, München, Wien und Zürich verfügen über spezialisierte Studios, die ausschließlich auf Browser-3D-Pipelines mit glTF-zentrierter Asset-Verwaltung arbeiten. Die Reifung des Formats und die parallele Reifung der Browser-3D-Engines haben in zehn Jahren etwas geschaffen, was VRML in seinen besten Tagen nicht erreichte: einen tatsächlichen, in der Breite akzeptierten Web-3D-Standard.

Ausblick

In den nächsten Jahren erwartet die Branche weitere Erweiterungen zum Format: Variants (für Konfigurator-Anwendungen), bessere Skinning-Modelle, performantere Animations-Repräsentationen, Volume- und Subsurface-Scattering-Erweiterungen für realistischere Material-Pipelines. Die KHR_audio-Erweiterung adressiert räumliches Audio in WebXR-Szenen, eine bislang nicht-standardisierte Lücke. KHR_interactivity, in den letzten Jahren in der Spezifikationsphase, soll grundlegende Interaktivität in das Asset selbst einbetten — ein Bereich, in dem glTF historisch passiv blieb.

Was sich nicht ändern wird, ist die Grundkonstellation: glTF ist ohne kommerziellen Eigentümer, mit offener Spezifikation, von einem Konsortium gepflegt. In einer Branche, die historisch von proprietären Format-Lock-ins geprägt war, ist das eine bemerkenswerte Konstellation — und einer der zentralen Gründe, warum DACH-Studios und -Unternehmen das Format ohne Lizenz-Sorgen in ihre Pipelines integrieren konnten.

Performance-Profile und mobile Endgeräte

Eine konkrete Herausforderung, der sich glTF-Pipelines in der Praxis stellen müssen, ist das breite Spektrum der Zielgeräte. Ein Browser-3D-Asset, das auf einer Desktop-Workstation mit dedizierter GPU lädt, muss in der Regel auch auf einem mittelpreisigen Android-Smartphone und einem iPad der vorvorherigen Generation funktionieren. Das stellt Anforderungen an Polygon-Budgets, Textur-Auflösung, Material-Komplexität und Initial-Ladegrößen, die in klassischen Studio-Pipelines so nicht auftreten.

DACH-E-Commerce-Studios mit Browser-3D-Schwerpunkt arbeiten deshalb mit gestaffelten Liefer-Qualitäten: hochaufgelöste Master-Assets, daraus generierte Reduktionsstufen für unterschiedliche Bandbreiten- und Hardware-Klassen. gltfpack, das von Arseny Kapoulkine entwickelte Optimierungs-Tool, automatisiert wesentliche Schritte dieser Pipeline. Draco-Komprimierung für Geometrie und KTX2-Texturen mit BasisU-Supercompression sind die zentralen technischen Hebel.

Rechtliche Klärungen

Die Lizenz-Situation rund um glTF selbst ist eindeutig: Die Spezifikation steht unter einer offenen Khronos-Lizenz, Implementierungen sind frei möglich. Komplexer wird es bei den eingebetteten Texturen und Modellen. Wer ein 3D-Asset aus einer Online-Bibliothek bezieht, muss prüfen, welche Lizenz die jeweilige Plattform vorsieht. Sketchfab differenziert zwischen mehreren Creative-Commons-Lizenzen und einer eigenen Store-Lizenz; Khronos selbst stellt unter dem Namen „Khronos glTF Sample Assets” eine MIT- beziehungsweise CC0-lizenzierte Referenz-Sammlung bereit, die für Implementierungs-Tests und Schulungszwecke produktiv nutzbar ist.

In DACH-Konfigurator-Projekten, in denen Marken-Eigentum eine zentrale Rolle spielt, sind die Assets in der Regel im Eigentum des Auftraggebers; die rechtliche Frage konzentriert sich dort auf das verwendete Material-System und auf die Auslieferungs-Infrastruktur. Wer eine Konfigurator-Plattform baut, schließt mit dem Auftraggeber Nutzungsrechte für die ausgelieferten Browser-Anwendungen ab, die in der Regel keine Format-spezifischen Komplikationen verursachen.


Ressort: Web3D