Ein mathematisches Optimierungsmodell mit endogenem Preis, Produktdepreziation und nicht-linearer Kundenbindung
Retouren kosten Geld — aber sie binden Kunden. Wo liegt das Optimum, das Unternehmen anstreben sollten?
Bower & Maxham (2012): Kostenlose Retouren steigern Käufe um +58 bis +357%, aber Retourengebühren senken Käufe um −74 bis −100%. Die Asymmetrie ist der Schlüssel.
Bestehende Modelle behandeln Retourenkosten, Kundenbindung und Preissetzung getrennt. Kein Modell integriert alle drei in einer geschlossenen Lösung.
Welche Retourenquote β* maximiert den langfristigen Gewinn unter Berücksichtigung von CLV, Wertverlust und endogener Preissetzung?
| Ansatz | Kosten | CLV | Preis |
|---|---|---|---|
| Newsvendor | ✓ | — | teilw. |
| CLV-Literatur | — | ✓ | — |
| Spieltheorie | ✓ | — | ✓ |
| ML / Data-driven | ✓ | — | — |
| Diese Arbeit | ✓ | ✓ | ✓ |
Jedes verkaufte Produkt erzielt einen Deckungsbeitrag. Jede Retoure verursacht Kosten. Der Netto-Deckungsbeitrag:
In kompakter Notation mit A = p-c+r und B = p-c-d:
Linear fallend in β mit Steigung −A.
| Symbol | Bedeutung |
|---|---|
| p | Verkaufspreis |
| c | Variable Kosten |
| d | Distributionskosten |
| r | Retourenkosten |
| β | Retourenquote [0,1] |
| i | Diskontierungssatz |
Retournierte Produkte werden wiederverkauft. Geometrische Reihe mit q = β/(1+i):
Retourenkulanz steigert Bindung linear:
Integration über unendliche Kohorten und Perioden:
β erscheint hier als Entscheidungsvariable — im vollen Modell (Slide 12–13) wird β zum Ergebnis der Instrumente V, p und f.
Die FOC ∂Π/∂β = 0 führt auf die quadratische Gleichung Q(β) = VAβ² − 2VBβ + E = 0 mit Lösung:
mit C = Ai + r + d und F = [A(1+i−1/n) − VB] / V
Ein inneres Maximum β* ∈ (0,1) existiert genau dann, wenn:
Interpretation: Vmin ist die minimale Retention-Sensitivität, ab der sich Retourenkulanz lohnt. Darunter: β* = 0.
Retournierte Ware verliert pro Zyklus einen Wertanteil δ. Fashion: 20–30% pro Monat nach Saisonpeak.
β* fällt streng monoton in δ. Beweis: Cδ/σ = A(1+i)/(1−δ) − B ist steigend in δ. ∎
Ab δmax ≈ 17% lohnt keine Retourenkulanz mehr.
| δ | β* | ΔΠ |
|---|---|---|
| 0 (Basis) | 12,8% | +1,1% |
| 5% | 9,1% | +0,6% |
| 10% | 5,4% | +0,2% |
| 17% (δmax) | ≈ 0% | 0% |
(Numerisches Beispiel mit Standardparametern: p=50, c=20, d=5, r=8, i=0,05, n=2, V=0,4, K₀=1.000)
Ersetze lineare Retention durch Potenzfunktion mit abnehmenden Grenzerträgen:
Für γ < 1 und V > 0 existiert immer ein inneres Maximum β* > 0. Die Schwellbedingung Vmin entfällt.
1. Für β → 0⁺: Qγ(β) → +∞, da βγ−1 → ∞ für γ < 1
2. Für β = B/A: Qγ < 0 (Zähler N wird null)
3. Stetigkeit ⟹ genau ein Vorzeichenwechsel ⟹ genau ein Maximum ∎
Der ∞-Grenznutzen der ersten marginalen Kulanz überwiegt stets die endlichen Grenzkosten. Ein Minimum an Retourenkulanz lohnt sich immer.
Szenario ③ ist das Marktversagen: Kunde zahlt p, erhält Nutzen Ulow ≪ p. Retourenkulanz adressiert dies.
Bei f=0, a=0 gilt β=μ. Kaufbedingung: U_i ≥ p/(1−μ). Nachfrage:
| Symbol | Bedeutung |
|---|---|
| M | Marktgröße |
| Ū | Max. Gebrauchsnutzen (U ~ U[0, Ū]) |
| μ | Mismatch-Wahrscheinlichkeit (= β bei f=0) |
| f | Retourengebühr in EUR (→ Erw. 5) |
| a | Hassle in EUR (→ niemand, DWL) |
Die FOC ∂Π/∂μ = 0 führt auf eine kubische Gleichung in μ (3 Nennerterme statt 2 wie im Grundmodell). Numerisch: μ* ≈ 24,4% bei Standardparametern. → Interaktive Berechnung auf Slide 15.
Additives ρ-Modell hat ∂K₀/∂β = konstant. Unrealistisch. μ-Modell hat ∂K₀/∂μ steigend — konvex, wie empirisch beobachtet.
Konsument i hat Gebrauchsnutzen U_i. Der Endowment-Effekt (Kahneman et al., 1990) verstärkt die WTP multiplikativ:
Kaufbedingung: U_i ≥ p/(1+θβ). Nachfrage:
Natürliche Konkavität im Nachfragekanal — analog zur γ-Konkavität im Retentionskanal.
WTP-Aufschlag: \Delta p^\theta = \theta\beta\bar{U}/2 + Retourenkosten
ξ = erwarteter Nettobetrag des Kunden. f = feste Retourengebühr in EUR (z.B. ASOS: 3,95 GBP)
FOCs ∂Π/∂p und ∂Π/∂f sind linear abhängig. Jedes (p, f) auf der Geraden
ist gleich profitabel. Das 3D-Problem (p, μ, f) reduziert sich auf 1D in μ.
Amazon (hohes p, f=0), ASOS (niedriges p, f>0), Zalando (mittleres p, f≈0) können alle gleich profitabel sein — wenn sie denselben ξ* implementieren.
Fließt an Händler. Gleicher τ-Effekt wie Friction, aber mit Erlös. Pareto-überlegen.
apol < 0. Kostet κ = |apol|·κr pro Retoure. Lohnt wenn Nachfragegewinn > κ.
apol > 0. Geht an niemanden (DWL). Strikt dominiert durch f.
Caveat: Gebühren können Loyalität überproportional schaden (Fairness-Normen). Nicht formalisiert.
| Segment | μ | p* | α | CLV× | Π* |
|---|---|---|---|---|---|
| Bücher | 5% | — | — | — | — |
| Elektronik | 15% | — | — | — | — |
| Schuhe | 30% | — | — | — | — |
| Fashion | 45% | — | — | — | — |
| Luxury | 60% | — | — | — | — |
*f=0, w je 30/25/20/15/10%. Standardparameter.
Vielretournierer (μ=60%) haben den höchsten CLV-Multiplikator (3,4×). ASOS sperrt sie deshalb nicht, sondern belegt sie mit Gebühren: Hohe Retention macht sie langfristig am wertvollsten.
τ = Nettoerstattung. L = max. Restwert bei Mismatch (Ulow ~ U[0,L]). β ist kein Instrument, sondern Ergebnis von (p, f, apol). Stets β ≤ μ.
Optionswert der Retoure — steigt konvex in τ. Dies ist die strukturelle Erklärung für das μ-Modell (Linearisierung) und θ (multiplikative WTP). Alle drei sind Varianten desselben Mechanismus.
① f dominiert Friction: Gleicher τ, aber f → Erlös, apol → DWL. ∴ apol* ≤ 0.
② Convenience: apol < 0 kostet κ = |apol|·κr. Optimal wenn Nachfragegewinn > κ.
② Volles Regime (L ≤ τ*): q*=1, β*=μ, (p,f)-Redundanz. Grundmodell exakt.
③ Selektives Regime (L > τ*): q*<1, β* < μ, f*=0, p* eindeutig. Marginale Mismatches behalten.
④ Verbindung: βeff* = Grundmodell-β*. Das Grundmodell ist die geschlossene Lösung des vollen Problems.
*Sequentielle Zerlegung (reihenfolge-abhängig): Nachfrage- und Preiskanal interagieren — ihre Anteile verschieben sich je nach Aktivierungsreihenfolge. Die Aussage „65% Preis / 35% Retention" im Paper basiert auf dem 2-Stufen-Vergleich exogen (p fix) vs. endogen (p*).
Jede retournierte Einheit erzeugt Kosten r+d. Ohne Gegeneffekt ist β*=0 trivial optimal. Isoliert betrachtet rechtfertigt kein Kosteneffekt eine positive Retourenquote.
Kulanz erhöht α = 1/n + Vβ^γ. Über den CLV-Multiplikator wirken höhere Bindungsraten auf alle Folgeperioden. Bei V=0 ist dieser Kanal inaktiv.
Bei μ > 0 reduziert Kulanz das Kaufrisiko. Mehr Konsumenten überschreiten die Kaufschwelle U_i ≥ p/(1−μ). Bei μ=0 ist dieser Kanal inaktiv.
Endogene Preissetzung internalisiert die Risikoreduktion. p*(μ) = (c+(1−μ)Ū)/2 + (d+μr)/(2(1−μ)). Bei μ=0 ist der Preiskanal inaktiv (kein Retourenkosten-Aufschlag).
Klicke auf eine Zeile für die ökonomische Interpretation. — *Numerisches Beispiel mit Standardparametern
| Strategie | β* | p* | Π | ΔΠ |
|---|---|---|---|---|
| Naiv (p=50, β=0) | 0% | 50,00 | 1.002.223 | Basis |
| Keine Retourenkulanz, fixer Preis. Der Händler verliert alle Kunden, die wegen Kaufunsicherheit nicht bestellen, und nutzt weder den Kundenbindungs- noch den Preiskanal. Benchmark für alle Vergleiche. | ||||
| Exogen optimal (p=50) | 26,8% | 50,00 | 1.104.364 | +10,2% |
| Nur β wird optimiert, p bleibt fix bei 50 €. Der Kundenbindungseffekt allein (Retentionskanal) rechtfertigt β* = 26,8%. Das ist die Empfehlung des reinen Grundmodells — und sie unterschätzt das Optimum massiv, weil der Preiskanal fehlt. | ||||
| Endogen linear (γ=1) | 43,7% | 63,32 | 1.290.574 | +28,8% |
| Preis und β werden simultan optimiert mit linearer Retention. β* springt von 26,8% auf 43,7%, weil der Händler Δp = 8,32 € Aufschlag verlangen kann. Der Preis steigt von 50 auf 63,32 €. Allein die Preisendogenisierung verdreifacht den Gewinnvorteil. | ||||
| Endogen konkav (γ=0,5) | 43,6% | 63,29 | 1.695.608 | +69,2% |
| Die konkave Retention (γ = 0,5) hebt den CLV-Effekt massiv: Schon bei moderatem β steigt die Kundenbindung stark an. β* ändert sich kaum (43,6%), aber der Gewinn steigt um weitere 400.000 €, weil der CLV-Multiplikator durch die konkave Bindungskurve verstärkt wird. Ohne Depreziation — daher optimistisches Szenario. | ||||
| Volles Modell (γ=0,5, δ=0,1) | 39,4% | 62,18 | 1.591.573 | +58,8% |
| Das realistischste Szenario: Konkave Retention + 10% Depreziation pro Wiederverkaufszyklus. Die Depreziation drückt β* von 43,6% auf 39,4% und den Preis von 63,29 auf 62,18 €. Dennoch bleibt ein Gewinnvorteil von +58,8% — fast 600.000 € gegenüber der naiven Strategie. Selbst mit konservativen Annahmen ist die optimale Retourenkulanz hoch. | ||||
Die Rangfolge Endogen-konkav > Endogen-linear > Exogen > Naiv ist invariant über alle getesteten Parameterkombinationen (6 Konfigurationen, 80 Parametervariationen).
▸ Warum ist f* ≈ r?
Im Surplus Φ steht der Term β·(r−f). Bei f=r verschwindet dieser — Retouren sind kostenneutral. Höheres f zerstört Nachfrage (τ↓), niedrigeres f kostet pro Retoure. f*≈r neutralisiert den Kostenkanal, sodass der Händler rein über Retention und Nachfrage profitiert.
▸ Warum β*=μ (Randlösung)?
Wenn der Retentionseffekt (V) und/oder der Resale-Zyklus stark genug sind, steigt Π monoton in β bis zur physischen Schranke β=μ. Alle Mismatches sollten retournieren. Reduziere V oder erhöhe δ für ein inneres Maximum.
▸ Warum ist Ū fixiert?
Ū=100 normiert die WTP auf [0, Ū]. Alle Preise sind als Anteil interpretierbar. Eine Variation von Ū skaliert nur die absoluten Gewinne, nicht die Struktur der optimalen Politik (β*, f*, p*/Ū).
▸ Warum steigen die Balken erst an und fallen dann?
Hump-Shape der diskontierten Periodengewinne: Zwei gegenläufige Kräfte wirken.
Aufstieg (t klein): In jeder Periode kommen K₀ Neukunden hinzu. Bestandskunden aus allen bisherigen Kohorten kaufen erneut. Die Kundenbasis wächst: Ktotal(t) = K₀·(1−αt+1)/(1−α). Der undiskontierte Periodengewinn steigt, weil sich Kohorten akkumulieren.
Abstieg (t groß): Der Diskontierungsfaktor (1+i)−t schrumpft exponentiell. Sobald die Wachstumsrate der Kundenbasis (die gegen null konvergiert, da α<1) unter den Diskontierungssatz i fällt, dominiert die Abdiskontierung → diskontierter Periodengewinn sinkt.
Peak: Dort, wo die Grenz-Kundenzuwachsrate = i. Niedriges i (z.B. 0,01) → später, höherer Peak. Hohes i (z.B. 0,2) → früher, niedrigerer Peak. Experimentiere mit dem i-Slider!
① Kundenhomogenität — Serial Returners nicht differenziert
Das Modell behandelt alle Kunden mit identischem β und V. Empirisch sind Serial Returners (11% der Kunden) für 24% aller Retouren verantwortlich (ZigZag, 2024). Hjort/Lantz (2016) zeigen, dass Kunden mit hoher Retourenquote teils niedrigere Gesamt-Deckungsbeiträge generieren. ASOS' 3-Stufen-Modell (2026) zeigt, wie die Praxis dieses Problem löst: differenzierte Gebühren nach individuellem Retourenverhalten.
② Keine strategischen Retouren — Wardrobing nicht modelliert
Wardrobing (Kauf mit Rückgabeabsicht nach einmaliger Nutzung) umfasst lt. NRF 103,8 Mrd. USD in 2024. Khouja/Hammami (2023) zeigen spieltheoretisch, dass Gutschriften statt Geldrückerstattungen Wardrobing überproportional abschrecken. Im vorliegenden Modell gibt es keine strategische Interaktion — alle Konsumenten sind ehrlich.
③ Keine Umweltkosten — 24 Mio. t CO₂/Jahr ignoriert
Roichman et al. (2024) zeigen: 22–44% retournierter Bekleidung erreicht nie einen weiteren Konsumenten. Die THG-Emissionen der Produktion dieser unverkauften Retouren übersteigen die Logistikemissionen um das 2- bis 16-fache. Mit steigenden CO₂-Preisen (EU-ETS) und Extended Producer Responsibility wird dies betriebswirtschaftlich relevant.
④ Monopol — Wettbewerbsinteraktion fehlt
Im Oligopol entsteht ein Gefangenendilemma: Wer Retourenpolitik verschärft, riskiert Kundenabwanderung zum kulanzfreudigeren Wettbewerber. Dies erklärt, warum die Branche jahrelang auf immer großzügigere Retouren konvergierte — erst seit 2023/24 kehrt sich der Trend um, koordiniert durch gleichzeitige Verschärfungen bei Zalando, ASOS und Inditex.
⑤ Statisches β — empirisch +48% vom 1. zum 10. Kauf
Eine 2025 publizierte Studie zeigt, dass die individuelle Retourenquote von 25% beim Erstkauf auf 37% beim zehnten Kauf steigt (+48%). Getrieben wird dies durch einen Retourengewohnheitseffekt, der den Markenerfahrungseffekt dominiert. Statische Modelle überschätzen den kumulierten CLV um ca. 40%.
Heterogene (Vs, γs, μs) → mehrdimensionale Optimierung
Ansatz: Aufteilung in k Segmente mit jeweils eigenen Parametern. Das Optimierungsproblem wird zu max Σ Π_s(β_s, p_s) über s=1..k. Analytisch nur für k=2 geschlossen lösbar, für k>2 numerisch. Praxisbezug: ASOS' 3-Stufen-Modell ist de facto eine Approximation dieses Problems.
Wardrobing als Gleichgewicht zwischen Händler und Konsument
Ansatz: Stackelberg-Spiel — Händler wählt (p, β), Konsumenten wählen (kaufen, behalten, wardroben). Das Nash-Gleichgewicht kann sich qualitativ vom Monopol-Optimum unterscheiden. Coughlan/Timoumi (Wharton) zeigen, dass Wardrobing-Toleranz manchmal dominiert, da Open-Box-Ware eine Sekundärmarkt-Preisdiskriminierung ermöglicht.
Retourenquote wächst über Kundenlebensdauer
Ansatz: β_m = β₀ + φ·m (lineare Zunahme pro Periode) oder β_m = β_∞ − (β_∞−β₀)e^(−λm) (Sättigungsfunktion). Integration in das Kohortenmodell erfordert eine modifizierte geometrische Reihe mit periodenabhängigen Koeffizienten — analytisch geschlossen nur für den linearen Fall, sonst numerisch.
Simultane Preis- und Retourenpolitik-Wahl im Wettbewerb
Ansatz: n Händler wählen simultan (p_i, β_i). Konsumenten verteilen sich nach Nutzen U_i/(1−μ_i) − p_i. Das Nash-Gleichgewicht tendiert zu höherem β* als im Monopol (Race to the Top bei Kulanz). Regulatorische Implikation: Koordinierte Verschärfung (wie 2024/25 bei Zalando/ASOS/Zara gleichzeitig) kann Pareto-verbessernd wirken.
β* steigt mit endogenem Preis. Der Preiseffekt dominiert ≈2:1 (65% Preis / 35% Retention+Nachfrage).
Konkave Retention eliminiert Vmin. Volles Modell: +58,8%.
Download: daisy.team/paper/retourenquote