Skip to content Skip to footer

Kundensegmentierung & Empfehlungssysteme

1. Einführung

Einführung in Kundensegmentierung und Empfehlungssysteme

Die Daten geprägten Welt ist es unerlässlich, Ihre Kunden zu verstehen und ihnen personalisierte Empfehlungen zu geben. Kundensegmentierung und Empfehlungssysteme sind dabei wertvolle Werkzeuge. Sie ermöglichen es Unternehmen, ihre Marketingstrategien zu verbessern und die Zufriedenheit ihrer Kunden zu steigern. In dieser Fallstudie erklären wir Ihnen, wie diese Systeme arbeiten und welche Vorteile sie Ihrem Unternehmen bringen können.

Simulation K-Means Clustring

Verstehen Sie Ihre Kunden besser und steigern Sie Ihre Konversionsraten durch intelligente Segmentierung und maßgeschneiderte Empfehlungen.

Was ist Kundensegmentierung?

Kundensegmentierung ist der Prozess, bei dem Kunden in Gruppen unterteilt werden, die ähnliche Eigenschaften oder Verhaltensmuster aufweisen. Dies ermöglicht es Unternehmen, ihre Marketingstrategien gezielt auf die Bedürfnisse und Vorlieben dieser Gruppen abzustimmen.

Arrow
Wie funktioniert ein Empfehlungssystem?

Ein Empfehlungssystem nutzt Datenanalysen und Algorithmen, um personalisierte Produktvorschläge für Ihre Kunden zu erstellen. Basierend auf ihrem bisherigen Verhalten und den Präferenzen ähnlicher Kunden, erhalten Ihre Kunden maßgeschneiderte Empfehlungen.

  • Personalisierte Einkaufserlebnisse: Steigern Sie die Zufriedenheit Ihrer Kunden durch relevante Produktvorschläge.
  • Erhöhte Verkaufszahlen: Nutzen Sie Cross-Selling und Upselling, um den durchschnittlichen Bestellwert zu erhöhen.
  • Verbesserte Kundenbindung: Begeistern Sie Ihre Kunden mit genau den Produkten, die sie suchen.

2. Beschreibung des Datensatzes

Der Datensatz

Unser Modell basiert auf einem umfassenden Datensatz, der Transaktionen eines Online-Einzelhändlers über einen bestimmten Zeitraum umfasst. Dieser Datensatz enthält Informationen über Bestellungen, Kunden-IDs, Produktdetails, Mengen und Preise.

 #   Column       Non-Null Count   Dtype  
---  ------       --------------   -----  
 0   InvoiceNo    541909 non-null  object 
 1   StockCode    541909 non-null  object 
 2   Description  540455 non-null  object 
 3   Quantity     541909 non-null  int64  
 4   InvoiceDate  541909 non-null  object 
 5   UnitPrice    541909 non-null  float64
 6   CustomerID   406829 non-null  float64
 7   Country      541909 non-null  object 
dtypes: float64(2), int64(1), object(5)
 Quantity      UnitPrice     CustomerID
count  541909.000000  541909.000000  406829.000000
mean        9.552250       4.611114   15287.690570
std       218.081158      96.759853    1713.600303
min    -80995.000000  -11062.060000   12346.000000
25%         1.000000       1.250000   13953.000000
50%         3.000000       2.080000   15152.000000
75%        10.000000       4.130000   16791.000000
max     80995.000000   38970.000000   18287.000000

3. Zielsetzung des Modells

Das Hauptziel unseres Modells ist es, Kunden in verschiedene Segmente zu unterteilen und personalisierte Produktempfehlungen zu generieren. Dadurch können Unternehmen gezielte Marketingstrategien entwickeln und die Kundenbindung verbessern.

Erfahren Sie, wie wir Ihre Kunden segmentieren und personalisierte Empfehlungen erstellen können.

Kundensegmentierung & Empfehlungssysteme

4. Methodik

Datenbereinigung und – transformation

Der erste Schritt in unserer Analyse ist die Datenbereinigung und -transformation. Hier behandeln wir fehlende Werte, Duplikate und Anomalien, um sicherzustellen, dass die Daten für die Analyse bereit sind.

Umgang mit Null-Preisen
Umgang mit Null-Preisen
   InvoiceNo StockCode                          Description  Quantity     InvoiceDate  UnitPrice  CustomerID         Country
0    536365    85123A   WHITE HANGING HEART T-LIGHT HOLDER         6  12/1/2010 8:26       2.55     17850.0  United Kingdom
1    536365     71053                  WHITE METAL LANTERN         6  12/1/2010 8:26       3.39     17850.0  United Kingdom
2    536365    84406B       CREAM CUPID HEARTS COAT HANGER         8  12/1/2010 8:26       2.75     17850.0  United Kingdom
3    536365    84029G  KNITTED UNION FLAG HOT WATER BOTTLE         6  12/1/2010 8:26       3.39     17850.0  United Kingdom
4    536365    84029E       RED WOOLLY HOTTIE WHITE HEART.         6  12/1/2010 8:26       3.39     17850.0  United Kingdom
5    536365     22752         SET 7 BABUSHKA NESTING BOXES         2  12/1/2010 8:26       7.65     17850.0  United Kingdom
6    536365     21730    GLASS STAR FROSTED T-LIGHT HOLDER         6  12/1/2010 8:26       4.25     17850.0  United Kingdom
7    536366     22633               HAND WARMER UNION JACK         6  12/1/2010 8:28       1.85     17850.0  United Kingdom
8    536366     22632            HAND WARMER RED POLKA DOT         6  12/1/2010 8:28       1.85     17850.0  United Kingdom
9    536367     84879        ASSORTED COLOUR BIRD ORNAMENT        32  12/1/2010 8:34       1.69     13047.0  United Kingdom
Behandlung von Ausreißern
data = data[(data['Quantity'] > 0) & (data['Quantity'] < data['Quantity'].quantile(0.99))]
data = data[(data['UnitPrice'] < data['UnitPrice'].quantile(0.99))]
print("Behandlung von Ausreißern", data.head(10))
 InvoiceNo StockCode                          Description  Quantity     InvoiceDate  UnitPrice  CustomerID         Country
0    536365    85123A   WHITE HANGING HEART T-LIGHT HOLDER         6  12/1/2010 8:26       2.55     17850.0  United Kingdom
1    536365     71053                  WHITE METAL LANTERN         6  12/1/2010 8:26       3.39     17850.0  United Kingdom
2    536365    84406B       CREAM CUPID HEARTS COAT HANGER         8  12/1/2010 8:26       2.75     17850.0  United Kingdom
3    536365    84029G  KNITTED UNION FLAG HOT WATER BOTTLE         6  12/1/2010 8:26       3.39     17850.0  United Kingdom
4    536365    84029E       RED WOOLLY HOTTIE WHITE HEART.         6  12/1/2010 8:26       3.39     17850.0  United Kingdom
5    536365     22752         SET 7 BABUSHKA NESTING BOXES         2  12/1/2010 8:26       7.65     17850.0  United Kingdom
6    536365     21730    GLASS STAR FROSTED T-LIGHT HOLDER         6  12/1/2010 8:26       4.25     17850.0  United Kingdom
7    536366     22633               HAND WARMER UNION JACK         6  12/1/2010 8:28       1.85     17850.0  United Kingdom
8    536366     22632            HAND WARMER RED POLKA DOT         6  12/1/2010 8:28       1.85     17850.0  United Kingdom
9    536367     84879        ASSORTED COLOUR BIRD ORNAMENT        32  12/1/2010 8:34       1.69     13047.0  United Kingdom
Feature-Engineering

Im Feature-Engineering-Schritt erstellen wir neue Merkmale aus den vorhandenen Daten, die zur Verbesserung der Modellergebnisse beitragen. Dazu gehören Recency, Frequency, Monetary (RFM) Werte und weitere verhaltensbezogene Merkmale.

“ProductVariety” ist der Anzahl der unterschiedlichen Produkten, die der Kunde gekauft hat. Höhere Werte zeigen eine größere Vielfalt an gekauften Produkten.:

Die Daten enthalten Informationen über verschiedene Kunden, die anhand von vier Hauptmetriken beschrieben werden: Recency, Frequency, Monetary und Product Variety. Diese Metriken bieten Einblicke in das Kaufverhalten der Kunden und ermöglichen eine effektive Segmentierung für gezielte Marketingstrategien.

Die Daten zeigen unterschiedliche Kaufverhaltensmuster der Kunden. Einige Kunden, wie z.B. CustomerID 12347.0 und 12357.0, sind sehr aktiv und wertvoll, während andere, wie z.B. CustomerID 12350.0 und 12353.0, weniger aktiv sind. Diese Informationen können verwendet werden, um gezielte Marketingstrategien und personalisierte Angebote zu entwickeln, die die Kundenbindung und den Umsatz verbessern.

            Recency  Frequency  Monetary  ProductVariety
CustomerID
12347.0           2        177    429.17             101
12348.0          75         16     14.04              15
12349.0          18         69    236.45              69
12350.0         310         16     25.30              16
12352.0          36         75    288.31              56
12353.0         204          4     24.30               4
12354.0         232         54    195.42              54
12355.0         214         12     41.90              12
12356.0          22         54    144.53              51
12357.0          33        127    371.02             127

Die Daten enthalten Informationen über verschiedene Kunden und bieten Einblicke in ihr Kaufverhalten anhand von fünf Hauptmetriken: Recency, Frequency, Monetary, Product Variety und Average Quantity. Diese Metriken sind entscheidend für die Entwicklung gezielter Marketingstrategien und die Verbesserung der Kundenbindung.

Spaltenbeschreibung

CustomerID: Eindeutige Kennung für jeden Kunden.

Recency: Anzahl der Tage seit dem letzten Kauf. Niedrige Werte deuten darauf hin, dass der Kunde kürzlich einen Kauf getätigt hat, während hohe Werte auf eine längere Zeit seit dem letzten Kauf hinweisen.

Frequency: Anzahl der Käufe, die ein Kunde getätigt hat. Höhere Werte bedeuten, dass der Kunde häufig kauft.

Monetary: Gesamtbetrag, den der Kunde ausgegeben hat. Dies zeigt den Gesamtwert der Transaktionen eines Kunden.

ProductVariety: Anzahl unterschiedlicher Produkte, die der Kunde gekauft hat. Höhere Werte zeigen eine größere Vielfalt an gekauften Produkten.

Verhaltensmerkmale
             Recency  Frequency  Monetary  ProductVariety  AvgQuantity
CustomerID
12347.0           2        177    429.17             101    12.446328
12348.0          75         16     14.04              15    54.250000
12349.0          18         69    236.45              69     9.043478
12350.0         310         16     25.30              16    12.250000
12352.0          36         75    288.31              56     6.946667
12353.0         204          4     24.30               4     5.000000
12354.0         232         54    195.42              54     9.740741
12355.0         214         12     41.90              12    19.833333
12356.0          22         54    144.53              51    24.574074
12357.0          33        127    371.02             127    21.188976
Korrelationsanalyse Heatmap:

Recency hat eine negative Korrelation mit Frequency (-0.36), Monetary (-0.34) und Product Variety (-0.35), was bedeutet, dass Kunden, die kürzlich gekauft haben, tendenziell häufiger kaufen, mehr ausgeben und eine größere Produktvielfalt aufweisen.

Frequency, Monetary und Product Variety sind stark positiv korreliert (0.95 bzw. 0.9), was darauf hinweist, dass Kunden, die häufiger kaufen, auch mehr Geld ausgeben und eine größere Produktvielfalt haben.

AvgQuantity zeigt schwache negative Korrelationen mit Frequency (-0.16), Monetary (-0.18) und Product Variety (-0.22), was bedeutet, dass höhere durchschnittliche Bestellmengen nicht unbedingt mit höheren Frequenzen oder Ausgaben korrelieren.

Cancellations hat keine signifikante Korrelation zu den anderen Metriken, was darauf hinweist, dass Stornierungen unabhängig von den anderen Verhaltensmetriken aufgetreten.

Country Variety zeigt ebenfalls keine signifikanten Korrelationen mit den anderen Metriken, was darauf hinweist, dass die Anzahl der Länder, in denen ein Kunde einkauft, nicht stark mit anderen Kaufverhaltensmerkmalen zusammenhängt.

Die Heatmap liefert wertvolle Einblicke in die Zusammenhänge zwischen verschiedenen Kundenverhaltensmetriken. Die starken positiven Korrelationen zwischen Frequency, Monetary und Product Variety deuten darauf hin, dass häufige Käufer auch tendenziell mehr Geld ausgeben und eine größere Vielfalt an Produkten kaufen. Unternehmen können diese Informationen nutzen, um gezielte Marketingstrategien zu entwickeln, die darauf abzielen, die Kaufhäufigkeit, die Ausgaben und die Produktvielfalt zu erhöhen. Schwache oder nicht vorhandene Korrelationen (wie bei AvgQuantity und Cancellations) weisen darauf hin, dass diese Metriken möglicherweise unabhängig von anderen Faktoren sind und separat betrachtet werden sollten.

Korrelationsanalyse Heatmap:
Korrelationsanalyse Heatmap:
Clustering

Mithilfe von Clustering-Algorithmen wie K-Means, DBSCAN und Gaussian Mixture Models segmentieren wir die Kunden in verschiedene Gruppen. Jede Gruppe repräsentiert ein Kundensegment mit ähnlichem Verhalten und ähnlichen Vorlieben.

# K-Means-Clustering
wcss = []
silhouette_scores = []
for i in range(2, 11):
    kmeans = KMeans(n_clusters=i, random_state=0)
    kmeans.fit(rfm_pca)
    wcss.append(kmeans.inertia_)
    silhouette_scores.append(silhouette_score(rfm_pca, kmeans.labels_))
Optimale Anzahl von Clustern basierend auf dem Silhouette-Score: 2
K-Means Silhouette-Score: 0,6306679294170593
K-Means Davies-Bouldin-Index: 0,6340459172479778
DBSCAN Silhouette-Score: 0,7887570239350103
DBSCAN Davies-Bouldin-Index: 1,1489715485530507
GMM Silhouette-Score: 0,5965535769238106
GMM Davies-Bouldin-Index: 1,4169375753496465
Berechnung und Bewertung der Cluster:
K-Means:
  • Silhouette-Score: Ein Score von 0,63 zeigt eine gute, aber nicht perfekte Clusterkohäsion.
  • Davies-Bouldin-Index: Ein niedriger Wert von 0,63 deutet auf gut getrennte Cluster hin.
DBSCAN:
  • Silhouette-Score: Der Score von 0,79 ist der höchste unter den drei Algorithmen, was auf sehr gut kohäsive Cluster hinweist.
  • Davies-Bouldin-Index: Ein Wert von 1,15 ist höher als der von K-Means, was darauf hinweist, dass die Clustertrennung nicht so gut ist.
GMM:
  • Silhouette-Score: Der Score von 0,60 zeigt die niedrigste Clusterkohäsion unter den drei Algorithmen.
  • Davies-Bouldin-Index: Ein hoher Wert von 1,42 zeigt, dass die Cluster am wenigsten gut getrennt sind.
Cluster-0
  • Die meisten Datenpunkte haben hohe Silhouette-Koeffizienten, nahe bei 0,6, was auf eine gute Clusterkohäsion hinweist.
  • Die Silhouette-Koeffizienten für Cluster 0 reichen bis zu 0,8, was zeigt, dass einige Datenpunkte sehr gut in dieses Cluster passen.
Cluster-1
  • Die Datenpunkte in Cluster 1 haben Silhouette-Koeffizienten, die hauptsächlich zwischen 0 und 0,4 liegen.
  • Dies deutet darauf hin, dass die Clusterkohäsion hier geringer ist als in Cluster 0.

Diese Heatmap zeigt die Mittelpunkte der Cluster für verschiedene Metriken. Cluster 0 hat deutlich höhere Werte in Frequenz, Monetärem Wert und Produktvielfalt, während Cluster 1 höhere Werte in der Recency und durchschnittlichen Bestellmenge aufweist.

Cluster-Zentren
Cluster-Zentren

Dieses Diagramm vergleicht die Recency-Verteilung der beiden Cluster. Cluster 0 zeigt eine starke Konzentration bei niedrigen Recency-Werten, was auf kürzlich getätigte Käufe hinweist, während Cluster 1 eine breitere Verteilung hat.

Die Verteilung der Kaufhäufigkeit zeigt, dass Cluster 0 eine breite Verteilung und höhere Frequenzwerte aufweist, während Cluster 1 eine engere Verteilung mit niedrigeren Frequenzwerten hat.

Und hierzeigt, dass Cluster 0 Kunden mit höheren Ausgaben umfasst, während Cluster 1 Kunden mit niedrigeren Ausgaben enthält.

Empfehlungssystem

Unser Empfehlungssystem kombiniert Collaborative Filtering und Content-Based Filtering, um personalisierte Produktempfehlungen für jeden Kunden zu generieren. Dies verbessert das Kundenerlebnis und steigert die Verkaufszahlen.

Erfahren Sie, wie unsere Empfehlungssysteme funktionieren.

Recommendation System Process
Recommendation System Process

5. Ergebnisse

Visualisierungen

Die Ergebnisse unserer Analyse zeigen, dass durch die Kundensegmentierung und die Implementierung eines Empfehlungssystems eine signifikante Verbesserung der Kundenbindung und der Verkaufszahlen erreicht werden kann. Die Silhouette-Scores und die Visualisierung der Cluster zeigen eine klare Trennung zwischen den Kundensegmenten, was die Genauigkeit unserer Segmentierung bestätigt.

Empfohlene Produkte für Kunde
Empfohlene Produkte für Kunde 12347.0: ['15044B', '15036', '84226', '10002', '22978']

Dieses Histogramm zeigt die Recency-Verteilung für beide Cluster. Cluster 1 hat eine breitere Verteilung und höhere Recency-Werte, während Cluster 0 eine engere Verteilung mit niedrigeren Werten aufweist.

Die Verteilung der Kaufhäufigkeit zeigt, dass Cluster 0 eine breitere Verteilung und höhere Frequenzwerte aufweist, während Cluster 1 eine engere Verteilung mit niedrigeren Frequenzwerten hat.

Dieses Diagramm zeigt, dass Cluster 0 Kunden mit höheren Ausgaben umfasst, während Cluster 1 Kunden mit niedrigeren Ausgaben enthält.

Die Verteilung der Produktvielfalt zeigt, dass Cluster 0 eine größere Vielfalt an gekauften Produkten aufweist, während Cluster 1 eine engere Verteilung und niedrigere Werte hat.

Beide Cluster haben ähnliche Verteilungen der durchschnittlichen Bestellmenge, jedoch mit leichten Unterschieden, wobei Cluster 1 tendenziell höhere Durchschnittswerte aufweist.

Dieses Diagramm zeigt, dass die meisten Kunden aus einem einzigen Land stammen. Cluster 0 und Cluster 1 haben eine ähnliche Verteilung der Länderdiversität.

6. Vorteile der Kundensegmentierung und Empfehlungssysteme

Die Implementierung von Kundensegmentierung und Empfehlungssystemen bietet zahlreiche Vorteile, darunter:

Kundensegmentierung und Empfehlungssysteme
Verbesserte Kundenbindung

Verbesserte Kundenbindung

Gezielte Marketingstrategien

Gezielte Marketingstrategien

Erhöhte Verkaufszahlen

Erhöhte Verkaufszahlen

Bessere Kundenerfahrung

Bessere Kundenerfahrung

Erfahren Sie, wie Ihr Unternehmen von diesen Vorteilen profitieren kann.

7. Fallstudie Zusammenfassung

Unsere Fallstudie zeigt, wie wichtig die Kundensegmentierung und Empfehlungssysteme für den Erfolg eines Unternehmens sind. Durch die Analyse und das Verständnis der Kundenverhalten können Unternehmen ihre Strategien optimieren und eine personalisierte Kundenerfahrung bieten.

Kontakt

Möchten Sie mehr darüber erfahren, wie Kundensegmentierung und Empfehlungssysteme Ihrem Unternehmen helfen können? Kontaktieren Sie uns noch heute und wir zeigen Ihnen, wie Sie von diesen leistungsstarken Werkzeugen profitieren können.

Issam Abu Sinneh
Issam Abu Sinneh
Ascend Sphere Kontakt

Fordern Sie Ihr individuelles Angebot an.

EINFACH & UNVERBINDLICH

Füllen Sie unser Formular aus, und wir senden Ihnen umgehend ein maßgeschneidertes Angebot.

    Go to Top
    WordPress Cookie Plugin von Real Cookie Banner