Angewandte Statistik (Problem) < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 22:29 So 04.08.2013 | Autor: | Yuumura |
Aufgabe | Messen Sie aus den Verkaufs-Daten (Zeitintervalle) die Anzahl der Waren lücken (Ware nicht Verfügbar) |
Hallo,
Ich hoffe ich bin hier richtig, auch wenn ich keine Konkrete Aufgabenstellung sondern ein Projekt habe und wir eine Gruppe von leider Statistisch/mathematisch etwas ungebildeten Leuten sind
Wir wollen nämlich in einem Geschäft (z.B Baumarkt, Aldi..) anhand der Daten über die Verkauften Produkte etwas über die Anzahl der nicht verfügbaren Produkte aussagen also etwas über die Verfügbarkeit der Waren herausfinden...
In der Literatur wurde das über eine Wartezeitanalyse gemacht, die wir auch gerne anwenden würden. Man hat also z.B in einer Woche 100 Verkaufte Produkte von Artikel A und geschaut wielange das Zeitintervall zwischen den Verkäufen von Artikel A ist.
Wenn das Zeitintervall zwischen zwei Verkäufen zu groß ist, dann ist das für uns ein Zeichen, dass da etwas nicht in Ordnung ist ;)
Unser Problem ist jetzt, wir wissen nicht wie wir diesen kritischen Zeitintervall (ab dem etwas nicht in Ordnung ist...also die Ware nicht verfügbar) bestimmen sollen.
Das logischste wäre erst einmal die durchschnittliche Verkaufsrate von Artikel A zu berechnen. Aber wir können nicht nachhaltig begründen, was wir mit diesem Wert machen. Wir können ja nicht willkürlich festlegen, dass das durchschnittliche Zeitintervall zwischen zwei Verkäufen multipliziert mit irgendeiner Zahl (z.B. 3*DurchschnittlicherZeitintervallZwischenZweiVerkäufe) unser kritischer Korridor ist und die Anzahl der Zeitintervalle, die größer sind, einfach zählen (auch wenn wir das gerne würden).
Ist es möglich hier mit Verteilungen (z.B Normalverteilung / Poissonverteilungen) zu arbeiten um statistisch korrekt eine Menge einzuschließen um etwas über das kritische Zeitintervall aussagen zu können?
In der Literatur hat man per Häufigkeitsverteilung einen Schwellen wert gebildet bzw. einen Konfidenzintervall aufgebaut: z.B 90% der Artikel wurden in <20 Min verkauft. (man geht davon aus, dass 10% der Artikel sowieso nicht verfügbar sind…)
So hat man einen kritischen Zeitwert von 20min und dann gezählt, wie häufig Zeitintervalle zwischen zwei Verkäufe von Produkt A größer als 20 Min sind. Das Problem dabei ist, dass wir nur einen Datensatz haben, und wenn wir aus diesem Datensatz eine Häufigkeitsverteilung untersuchen, können wir mit dem damit gewonnen Schwellenwert (Oben 20 Min) ja nicht denselben Datensatz untersuchen.
Und wenn wir den Schwellenwert aus einer Beobachtung (z.B Woche 1) gewinnen und dann in einer anderen Woche die Anzahl der Intervalle die länger als „20 min“ messen, scheint dies auch recht willkürlich.
Gibt es hier eine Möglichkeit durch Statistik/Verteilungen Abhilfe zu schaffen?
Wir wären für jeden Hinweis dankbar, auch, wenn es nur ein Hinweis wäre auf eine mathematische Disziplin, welches unser Problem lösen könnte.
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 12:45 Mo 05.08.2013 | Autor: | Infinit |
Hallo Yuumura,
ich glaube nicht, dass es zu dieser Fragestellung eine eindeutige Antwort gibt und deswegen habe ich den Artikel mal in eine Umfrage umgewandelt, um verschiedene Ideen sammeln zu können.
Sobald Du mit einer statistischen Verteilung an solch eine Aufgabe rangehst, hast Du ja im Allgemeinen eine Verteilung in Abhängigkeit von der Zeit und so lässt sich natürlich eine Aussage treffen, z.B. wie schnell die restlichen 10% eines Artikels verkauft werden, wenn 90% in 20 Minuten weg waren. Ob dies zu eurer Aufgabenstellung passt, kann ich nicht sagen, denn darüber hast Du bisher nichts geschrieben. Was soll mit solch einer Rechnung bewirkt werden? Muss Nachschub rechtzeitg geordert werden, der braucht eine bestimmte Zeit, um geliefert zu werden, oder geht es um ein Abverkaufsmodell, um zu sehen, wie schnell das eigene Zwischenlager geleert wird. Der Hintergrund Deiner Frage ist noch nicht so klar, wie er eventuell sein könnte. Aufgrund der Ferienzeit glaube ich auch nicht, dass Du innerhalb Deiner gewünschten Zeitspanne genügend Ideen sammeln kannst, eventuell ist es sinnvoll, die Antwortzeit noch mal zu verlängern.
Viele Grüße,
Infinit
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 19:43 Mo 05.08.2013 | Autor: | Yuumura |
Aufgabe | Automatisches system zur Zählung von Leeren Regalplätzen (Bestands-lücken) anhand der Verkaufs Daten eines Artikels. |
Okay, danke für die Antwort. Ich habe natürlich länger als 24h Zeit, das hatte ich bei der Frage nicht bedacht. Leider steht beim editieren, dass man nur 15 Minuten nach der Frage Zeit hat, die Dauer zu verlängern...
Zur Aufgabe: Also unser ziel ist es, einer Filiale die Leeren Regale zu zählen anhand der Abverkaufs-Daten (Eine Kennzahl dafür entwickeln..für die Warenverfüg barkeit) . Ein Leeres Regal wird Bestands-lücke oder Regallücke genannt.
Jeder Artikel wird im Durchschnitt nach einer gewissen Zeit verkauft. z.B im Durchschnitt geht alle 5 Min ein Artikel B über den Tisch. Wenn nun eine längere Zeit Artikel B nicht verkauft wurde, geht man davon aus, dass das Regal von Artikel B leer ist. Letztere SItuationen sollen gezählt werden.
Jetzt existiert in der Literatur ein Vorgehensmodell:
Es werden die Abverkaufs-daten genommen von Artikel B z.B vom letzten Monat.
Dann misst man die Zwischenzeit also die INtervallzeit zwischen den einzelnen Abverkaufen von Artikel B.
Unser Ziel ist es jetzt eine Kritische Wartezeit zu entwickeln mithilfe von Statistik, ab der wir sagen können, jetzt haben wir eine Regallücke, weil der letzte Abverkauf von B zu lange zurück liegt. Das kann z.B die dreifache Durchschnittsdauer zwischen zwei Abverkäufen von Artikel B sein. Ab diesem Zeitpunkt könnte man an den Daten sehen : hier ist eine Regallücke oder zumindest etwas faul (natürlich können zig Einflussfaktoren eine Rolle spielen, warum Artikel B solange nicht verkauft wurde, aber das spielt erstmal keine Rolle).
Jetzt ist die Frage, wie kann man dieses kritische Intervall bestimmen mithilfe von Statistik oder Verteilungen?
In der Literatur wurde das so gemacht: Man hat die Abverkaufsdaten von Artikel B für einein gewissen Zeitraum genommen und sich ein Häufigkeitsdiagramm gebastelt und geschaut nach wielang die einzelnen Zeitintervalle zwischen den Abverkäufen von Artikel B waren. Im durchschnitt evtl. 5 Minuten. Dann hat amn geschaut, innerhalb welcher Zeit 90% der Abverkaufsintervalle liegen: da kam 20 Minuten raus.
Häufigkeit: 90% = 20 min (Also man hat z.B 100 Zeitintervalle gemessen und 90 davon sind niedriger als 20 Min)
(Durchschnittsabverkauf nach 5 Min)
Und so hat man eine Grenze von 20 Min als kritische Wartezeit herausgefunden. ("Weil man davon ausgeht, dass 10 % sowieso Lücken sind...") Aber diese Grenze von 20 Minuten kann man ja nicht auf denselben Datensatz anwenden....
Das Problem ist, in der Literatur wurde ein automatisches Fehlersystem entwickelt und sobald die Zeit zwischen zwei Abverkäufen von Artikel B über 20 Min geht hat dieses System alarm geschlagen und im System ein Leeres Regal aufgezeichnet.
Aber was macht man, wenn man nur mit Vergangenheitsorientierten Daten arbeitet? SOllte man einen zweiten Datensatz aufnehmen im Markt? Oder kann man so eine Grenze wie die 20 Min (als schwellwert, also kritische Abverkaufszeit nahc deren Überschreiten eine Regallücke gezählt wird) statistisch irgendwie ausrechnen aus einem Datensatz wo man alle Zeiten also ABverkaufsdaten eines Artikels hat?
Da haben wir einen Knackpunkt, weil wir die Methode mit der Häufigkeitsbestimmung ja nicht auf denselben Datensatz anwenden können, aus denen wir die kritische Wartezeit ermitteln....
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 08:33 Di 06.08.2013 | Autor: | Infinit |
Hallo Yuumura,
danke für Deine ausfüherlichere Erläuterung, die mich das Problem jetzt bessser verstehen lässt. Die von Dir erwähnten 20 Minuten bis zur Kennzeichnung eines Regals als Leerregal sind ja wohl empirisch ermittelt worden und solange man nichts besseres hat, sollte man damit arbeiten.
Ich hoffe, es gibt noch ein paar Antworten von Mitgliedern, die sich mit so was besser auskennen als ich.
Viele Grüße,
Infinit
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 16:18 Di 06.08.2013 | Autor: | Yuumura |
Ja vielen Dank.
Wir würden auch gerne ein solche Minutenzahl empirisch ermitteln, das Problem ist nur, dass man die empirisch ermittelte Minutenzahl ja nicht auf denselben Datensatz anwenden kann um die Regallücken zu messen, aus denen man per Häufigkeitsverteilung die 20 Minuten ermittelt hat.
Wir arbeiten ja immer mit Vergangenheitsorientierten Daten und wollen aus einem Datensatz die leeren Regale "zählen" oder zumindest etwas über die Verfügbarkeit der Waren aussagen.
Macht es denn sinn, aus deinem Datensatz (zum Beispiel Abverkäufe der letzten Woche) einen Wert empirisch zu ermitteln (beispielsweise die 20 Minuten, nach deren Ablauf ein Abverkauf als "Regallücke" zählt) und dann einen zweiten Datensatz zu erheben auf denen man dann diese 20 Minuten Schwellenwert anwendet um dort die "Regallücken" zu zählen?
Ich finde den Bezugspunkt dann so willkürlich, weil wir uns noch andere Märkte anschauen wollen und vergleichen wollen, wie gut oder schlecht die Warenverfüg barkeit zwischen den Märkten ist...
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 18:52 Di 06.08.2013 | Autor: | Infinit |
Hallo Yuumura,
wenn Du eine Klassifikation vorhast, indem Du beispielsweise das Verhalten unterschiedlicher Märkte vergleichst, so macht es schon Sinn, mit solch einer Schwelle zu arbeiten. Ich würde hier zunächst einmal davon ausgehen, dass dies ein stationärer Prozess ist, zumindest über den Betrachtungszeitraum. Bei einem Jahreszeitenwechsel müsste man dann allerdings aufpassen. Eventuell liegt der Grund, dass seit mehr als 20 Minuten keine Skioveralls mehr verkauft wurden, darin, dass es Juli ist und es draußen 33 Grad sind. Das Regal liegt aber noch voll Wäsche. Sowas lässt sich aber mit solch einem Modell nie ausschließen. Was Du suchst, ist ja ein Trigger für eine Prozesssteuerung, und da kann man mit solch einem Ansatz durchaus starten. Gehe erst mal von der Stationarität aus und arbeite mit diesem Schwellenwert weiter, um die "Regallücken" zu zählen.
Viele Grüße,
Infinit
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 11:09 Fr 09.08.2013 | Autor: | Yuumura |
Danke für deine Antwort.
Ich habe jetzt eine konkrete Frage zur Ermittlung des Schwellenwertes.
Es gibt zwei Möglichkeiten diesen zu ermitteln.
Entweder wir nehmen ein vielfaches des Modalwertes (also des Intervalls, dass am häufigsten vorkommt, da der Durchschnitt durch ausreißer verfälscht wird).
Das wäre dann abe rrelativ willkürlich, z.B wäre immer, wenn ein intervall von der Länge her das vierfache des Modalintervalls überschreitet, eine "Regallücke".
WIr begründen, dass damit, dass wir bei allen Märkten das vierfache des Modalwertes annehmen und damit zumindest im vergleich eine gewisse Objektivität hätten.
Oder wir bestimmen den Schwellenwert über Häufigkeitsverteilungen frührer Datensätze für jedes Unternehmen (z.B innerhalb welcher Zeit liegen 90% der Intervalle/Abverkäufe) und wenden diese dann erneut auf einen zweiten Datensatz an, um dort dann die Regal lücken zu zählen.
Ich finde die zweite Vorgehensweise etwas willkürlich, weil man dann theoretisch ja nur misst, ob sich die SItuation zwischen den zweiten und den ersten Datensatz verbessert oder nicht.
Also 1. Ansatz: man nimmt (willkürlich) den Vielfaches des Modalwertes zur bestimmung des Schwellenwertes
2. Ansatz man misst über Häufigkeitsverteilungen alter Datensätze den Schwellenwert für neue Datensätze (es auf denselben Datensatz anzuwenden ist ja sinnlos.)
Ist theoretisch beides möglich oder gibt es hier einen Harken? Oder evtl. einen besseren Wert diesen Schwellenwert z.B empirisch zu ermitteln?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 11:27 Fr 09.08.2013 | Autor: | Infinit |
Hallo Yuumura,
wie ich in meiner Antwort weiter oben bereits schrieb, würde ich bei sol einem Prozess von Stationarität ausgehen, das heisst, die Charakteristiken ändern sich nicht über der Zeit (oder nur sehr moderat). Unter dieser Voraussetzung wäre dann Dein zweiter Ansatz anwendbar.
Viele Grüße,
Infinit
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 15:41 Fr 09.08.2013 | Autor: | Yuumura |
Aber ist nicht genau diese stationarität das Große Problem?
In der Praxis (Literatur) hat man diesen Ansatz genommen um aus empirischen Daten einen Schwellenwert mithilfe der Häufigkeitsverteilung zu gewinnen um dann in der Zukunft "Regal lücken" zu zählen (in echt-zeit)
Das tun wir ja nicht, wir machen "Manuell" defakto gar nichts in den Märkten. Wir haben NUR die Vergangenheitsbezogenen Verkaufsdaten. (Aus denen wir Regal lücken ableiten wollen).
Und wenn ich einen Datensatz habe und daraus den Schwellenwert empirische ermittle kann ich diesen Wert ja nicht benutzen um genau aus diesem (denselben) Datensatz die Regal lücken zu bestimmen? Ich müsste ja einen zweiten Datensatz nehmen.... Aber irgendwie fehlt mir hier die Objektivität. Was genau kann ich denn Aussagen, wenn aus Daten satz A einen Schwellenwert bestimme und ihn auf einen Datensatz aus dem selben Markt für dasselbe Artikel (der nur zu einem späteren Zeitpunkt gewonnen wurde) anwende um "fiktiv" die Regal lücken zu zählen?
Irgendwie finde ich die Vorgehensweise nicht schlüssig. Ich habe da irgendwie ein Verständnissproblem.
Sagen wir ich habe einen Datensatz in T1 beobachtet und da einen Schwellenwert empirisch ermittelt.
Dann wende ich ihn auf den Datensatz in T2 an.
Aber mit welcher Begründung? Wenn es in T1 sehr schlecht lief dann ist mein Schwellenwert entsprechend größer. Wenn ich diesen Wert (der in T1 ja immer 90% der Intervalle im Grünen und 10% der Intervalle im roten Bereich anzeigt) jetzt einfach auf T2 anwende, dann sehe ich doch nur, ob es eine verbeserung oder verschlechterung zwischen diesen beiden Zeitpunkten gab?
Das Problem ist ja, dass mein Schwellenwert durch viele oder wenige Regallücken in T1 ja beeinflusst wurde. Macht der Ansatz mit dem Modalwert nicht mehr sinn? Denn der Modalwert sagt ja mir eine Intervall länge an (Ich messe ja immer intervalle zwischen den Abverkäufen), nach der ein Produkt am häufigsten verkauft wurde. Z.B wurde ein Shampoo am häufigsten nach 5 Minuten verkauft. Dann ist der WErt von 5 Minuten mein Modus. Dann kann ich etwas aus diesem Modal wert machen, da die Regal lücken bzw. aussreisser diesen Wert ja nicht beeinflussen im gegensatz zur Häufigkeitsverteilung mit dem 90% Wert...
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 09:01 Sa 10.08.2013 | Autor: | Infinit |
Hallo Yuumura,
ich kann Deine Bedenken gut nachvollziehen, aber das heißt noch nicht, dass es dafür eine gut anwendbare mathematische Vorgehensweise gibt.
Die Stationarität ist sicherlich der einfachste Ansatz. Man nimmt die Meßdaten aus einer zeitlich davor liegenden Periode und wendet sie auf einen nun aktuellen Prozess an. Ich sage nicht, dass dies Deine Wünsche hundertprozentig erfüllt, aber es ist eine Vorgehensweise.
Wenn Du mit der Stationarität unglücklich bist, so kannst Du nur noch einen Prozess zeitlich modellieren. Da ihr aber de facto in den Märkten überhaupt nichts macht, stellt sich die Frage, wie ihr an sinnvolle Daten kommen wollt. Ich weiß es nicht und Du augenscheinlich ja auch nicht. Nimm also einfach mal die Stationarität an und schaue, was dabei auskommt.
Viele Grüße,
Infinit
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 11:26 Sa 10.08.2013 | Autor: | Yuumura |
In Ordnung Danke.
Jetzt habe ich nur noch eine letzte Frage:
Macht es mehr sinn, einen Gemeinsamen Schwellenwert für alle Märkte zu ermitteln indem man einfach die Abverkaufs Daten aller Märkte zusammenwürfelt und dann schaut, wie die einzelnen Märkte im Vergleich zu diesem Großen Gesamtschwellenwert abschneidet
Oder macht es mehr sinn, für jeden Markt individuelle Schwellenwerte (anhand der Vorgehenden Perioden) zu bilden und die "performance" jedes marktes an seinem eigenem Schwellenwert individuell zu messen?
Bei ersterem wäre ein vergleich einfacher, bei letzterem hätte man die Unterschiede zwischen den Märkten stärker berücksichtigt..
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 11:40 Sa 10.08.2013 | Autor: | Infinit |
Hallo Yuumura,
wenn Du unterschiedliche Werte für unerschiedliche Märkte benutzen kannst, so ist dies sicherlich genauer als wenn Du über alles mittelst. Wo ich auf jeden Fall unterscheiden würde, das sind die unterschiedlichen Produktklassen. Selbst in einem Supermarkt werden Lebensmittel sicherlich schneller umgesetzt als Mikrowellengeräte. Solch eine Produktunterscheidung, vorausgesetzt Du hast Zahlen dafür, macht sicher Sinn.
Viele Grüße,
Infinit
|
|
|
|