Was wir als Team machen Von Tarik Agayr, leitender Produktmanager für Datenwissenschaft und Analytik bei Shippeo
Im Laufe der Jahre haben wir eine beträchtliche Menge äußerst wertvoller Daten über die Logistikabläufe der Verlader mit Tracking-Informationen in Echtzeit gesammelt. Unser Team wurde gegründet, um diese Daten für die Entwicklung neuer „Datenprodukte“ zu nutzen.
Datenprodukte sind Produkte, deren primäres Ziel darin besteht, sich auf Daten zu verlassen, um ein Endziel zu erreichen. Bei Shippeo fallen diese in 4 verschiedene Kategorien:
- Rohdatenextraktion: Wir stellen die in Shippeo gespeicherten Daten so zur Verfügung, wie sie sind, für jeden, der sie extrahieren und verwenden möchte. Das ist die Shippeo EXPORT-Funktion, die wir ständig erweitern, wenn das Datenmodell mit neuen Informationen angereichert wird
- Analytik: Wir bieten Benutzern (sowohl internen als auch externen) Analysen, um Erkenntnisse aus den Daten zu gewinnen und ihnen bei ihrer Entscheidungsfindung zu helfen. Dazu gehören EINBLICKE (allgemeine Betriebsleistung, Nachverfolgung der Einhaltung von Vorschriften) sowie viele Dashboards, die das Team für unser Betriebsteam erstellt, um Fragen wie: „Wie relevant sind die Benachrichtigungen, die wir senden, zu beantworten?“ „Wie vergleichen sich die Telematikanbieter, mit denen wir verbunden sind, in Bezug auf Reichweite, Häufigkeit der gesendeten Positionen und Latenz?“ usw... Unser INSIGHTS-Angebot wird in den kommenden Monaten um eine eingehende Analyse der Leistung pro Spur erweitert
- Algorithmen: Wir entwickeln auch Algorithmen, um der „Echtzeitebene“ der Shippeo-Plattform eine „prädiktive Ebene“ hinzuzufügen. Wir erhalten einige Daten (Bestellung, Reiseroute, Positionsdaten...), aus denen wir viele Parameter extrahieren, um weitere Parameter zu generieren, indem wir die Rohdaten transformieren, um mithilfe von Methoden des maschinellen Lernens eine voraussichtliche Ankunftszeit für jeden Stopp der Reiseroute vorherzusagen
- Tools zur Entscheidungsunterstützung: Wir entwickeln Tools, um Benutzern die in den Daten enthaltenen Einblicke zu bieten, damit sie fundierte Entscheidungen treffen können. Ein Beispiel: Wir sind dabei, ein Tool namens RE-GEOCODE zu veröffentlichen, das Adressen erkennt, die nicht richtig geocodiert sind (aufgrund von Tippfehlern in den Adressdetails, fehlenden Ziffern in der Postleitzahl usw.), und dem Benutzer alternative Standorte vorschlägt, bei denen die Wahrscheinlichkeit höher ist, dass sie die richtigen sind, basierend auf historischen aufgezeichneten Reisen.
Wie wir solche leistungsstarken Algorithmen entwickeln, um eine genaue ETA zu ermitteln
Es gibt drei Schlüsselfaktoren, die wir erfüllen müssen, um erfolgreiche ML-Projekte durchzuführen.
Erstens die Definition klarer Ziele: Definition dessen, was wir erreichen wollen und was unserer Meinung nach der beste und effektivste Weg ist, um dieses Ziel zu erreichen.
Zweitens: Verlassen Sie sich auf ein internes Team mit gemischten Fähigkeiten: funktionale, Dateningenieure, Datenwissenschaftler. Unser Projekt wird nicht an externe Dienstleister ausgelagert, und wir beziehen während des gesamten ML-Projektlebenszyklus sachkundige Fachexperten ein.
Schließlich verwenden wir nur saubere Daten mit auswertbaren Datensätzen. Die Daten, die uns zur Verfügung stehen, erfüllen unsere Anforderungen sowohl in Bezug auf die Länge (ausreichende Anzahl von Datensätzen zum Trainieren von ML-Modellen) als auch in ihrer Breite (gründliche Liste der Variablen, die die Ausgabe beeinflussen können), und unser Team kennt den Inhalt der Daten und die inhärenten Regeln voll und ganz.
Wir verarbeiten und transformieren Rohdaten von hoher Qualität mit modernsten Techniken. Wir machen das seit Jahren. Wir haben verschiedene Ansätze ausprobiert. Wir wissen jetzt, was funktioniert.
Woran wir gerade arbeiten
Unser Team wird größer und wir werden besser.
Wir sind derzeit bestrebt, den globalen Durchschnittsfehler unserer ETA so weit wie möglich zu verringern (0 wäre ideal, aber leider nicht erreichbar) und auch die Varianz zu kontrollieren. Wir erstellen auch mehr Dashboards, um alles zu messen, was gemessen werden kann, und integrieren mehr Analysen, die fundierte Entscheidungen unterstützen.
Bei term wollen wir unseren Kunden die unangefochten beste voraussichtliche Ankunftszeit auf dem Markt bieten und beginnen, auf eine automatisierte Entscheidungsfindung hinzuarbeiten.
Latest blogs & product releases.
Authors




