Predicting arrival times of container vessels

Vrachtvervoer is een van de belangrijkste activiteiten van vandaag vanwege zijn invloed op alle economische sectoren. In haar thesis bestudeerde Nina hoe de aankomsttijden van container vessels kunnen worden voorspeld.

In deze blog

Binnen onze Digital Factory biedt eMagiz een uitdagende en inspirerende omgeving voor wetenschappelijk onderzoek naar Digital Transformation & Innovation. We vertalen strategische thema’s naar flexibele oplossingen voor een breed scala aan organisaties. eMagiz werkt samen met verschillende universiteiten en wetenschappelijke instellingen, zoals de Universiteit Twente, TKI Dinalog en NOW. We voeren innovatieve projecten uit om wetenschap en bedrijfsleven samen te brengen met oplossingen die het verschil maken. Onderwerpen waarin wij afstudeeronderzoek aanbieden liggen op het gebied van digitale transformatie, CI / CD, blockchain, BI en big data, machine learning, IoT en innovatie.

Vrachtvervoer is een van de belangrijkste activiteiten van vandaag vanwege zijn invloed op alle economische sectoren. Een Nederlandse Logistic Service Provider (LSP) hanteert momenteel een reactieve houding ten aanzien van aankomsttijdinformatie die uitsluitend is gebaseerd op het vaarschema van de vervoerder. Dit vaarschema blijkt echter historisch onbetrouwbaar: 20% van de orders die het LSP de afgelopen 2,5 jaar uitvoerde, kwam niet op tijd. Houd er rekening mee dat deze prestatie op tijd is gebaseerd op een drempel van minimaal zes dagen afwijking van de geplande aankomsttijd voordat een bestelling wordt geclassificeerd als ‘niet op tijd’. Wanneer slechts een afwijking van nul in de geplande aankomsttijd is toegestaan, wordt de op tijd presteren nog slechter: 74% van de bestellingen is niet op tijd aangekomen, en had een afwijking van minimaal één dag.

Klanten zijn zich bewust van de slechte prestaties van de LSP met betrekking tot aankomsttijdinformatie en uit een klantenonderzoek werd de behoefte aan het proactief verstrekken van nauwkeurigere aankomsttijdinformatie daadwerkelijk zichtbaar. Het niet precies weten wanneer een bestelling aankomt, heeft een negatief effect op de activiteiten van zowel het LSP als de klant in termen van verminderde efficiëntie en hogere kosten. Bij een afwijking in de Estimated Time of Arrival (ETA) is het LSP bezig met het vergroten van het klantcontact om de klant te informeren over de afwijking, dat anders niet nodig was geweest. In het ergste geval vreest het LSP mogelijk klantenverlies. De klant wordt met name financieel getroffen door een afwijkende ETA. Er ontstaan ​​verschuivingskosten wanneer de bestelling op een andere dag lijkt te arriveren dan de klant had gerekend. Of als de klant de goederen niet ad hoc kan ophalen, loopt de klant het risico om overliggelden in rekening te brengen. Om die reden geven klanten aan dat het ze niet zo veel kan schelen dat een bestelling te vroeg of te laat komt, maar ze willen wel precies weten wanneer de bestelling aankomt.

Aanpak

Het LSP verzamelt sinds oktober 2016 bestelgegevens en we gebruiken deze historische bestelgegevens om een ​​voorspellingsmodel te ontwikkelen dat de afwijking in de aankomsttijd voorafgaand aan de daadwerkelijke verzending kan voorspellen. Als het LSP vervolgens deze verwachte aankomsttijd aan de klant communiceert in plaats van de aankomsttijd die uitsluitend is gebaseerd op het vaarschema van de vervoerder, streven we ernaar te voldoen aan de behoeften van de klant om proactief een nauwkeurigere ETA te communiceren. Voor het ontwikkelen van het voorspellingsmodel maken we gebruik van historische ordergegevens van het LSP.

Eerst schonen we de data op en wordt hun kwaliteit aangepakt op de aanwezigheid van dubbelzinnigheid en ontbrekende waarden. De doelvariabele die we willen voorspellen, wordt de Delta genoemd en is het verschil in werkelijke en geplande aankomsttijd.

We gebruiken de wrapper-aanpak met een bidirectionele zoekmethode en vinden de volgende optimale subset van functies: vertrekweek (van het jaar), vertrekdag (van de week), aankomstweek (van het jaar), aankomstdag (van de week), vervoerder en de leveringshaven. Met de 6 voorspellende variabelen bouwen we ons voorspellingsmodel dat erop gericht is de delta te voorspellen, onze doelvariabele.


Variable importance measured by the percentual increase in MSE
Variable importance measured by the percentual increase in MSE

Result

Als resultaat van uitgebreid literatuuronderzoek en enkele experimentele tests, besluiten we random forest toe te passen als algoritme voor machine learning om ons model te trainen en te testen. Random forest algoritmes hebben enkele voordelen ten opzichte van andere technieken voor machine learning, omdat ze gecorreleerde voorspellende variabelen aankunnen, wat het geval is met enkele van de variabelen in ons model. Bovendien zijn willekeurige bossen bestand tegen overfitting. Na het trainen van het model kunnen we inderdaad concluderen dat het model een goede fit heeft.

Voordelen

Nu we een voorspellingsmodel hebben dat de afwijking van de gecommuniceerde aankomsttijd kan voorspellen, maken we de vertaling naar verbeterde bedrijfsprocessen voor zowel het LSP als de klant. We kiezen ervoor om een kostenbesparingsmodel vanuit het perspectief van de klant te benaderen, aangezien zij financieel het meest worden beïnvloed door de gebeurtenissen die rechtstreeks het gevolg zijn van een afwijking in de aankomsttijd. In het kostenbesparingsmodel zijn drie kostenparameters opgenomen:

  • demurrage fees
  • herschikkingskosten
  • kosten voor out of stock raken

De besparing is het verschil tussen de kosten in de huidige situatie minus de kosten in de nieuwe situatie. Het kostenbesparingsmodel laat zien dat verwacht wordt dat alle klanten samen gemiddeld € 771.025 euro op jaarbasis kunnen besparen wanneer het LSP de voorspelde ETA aan de klant communiceert in plaats van de aankomsttijd louter op basis van het vaarschema van de vervoerder.

De LSP heeft echter meer te winnen dan alleen een tevreden klant die kosten kan besparen door een nauwkeurigere ETA te krijgen. Daarom pakken we de verbeterde bedrijfsprocessen ook vanuit het perspectief van LSP’s aan. We kwantificeren hun verhoogde efficiëntie door de tijden te tellen dat het LSP nodig is om klantcontact te hebben in de huidige situatie en in de nieuwe situatie (waarin de ETA is gebaseerd op ons voorspellingsmodel). Klantcontact is vereist vanaf een afwijking van 4 dagen of meer en is bedoeld om de klant te informeren over de vertraging. Als we dan de huidige situatie vergelijken met de nieuwe situatie, dan is in 84% van de bestellingen geen klantcontact meer nodig aangezien de ETA niet zo veel afwijkt. Dit zou een positieve invloed hebben op de reputatie van LSP’s, aangezien de klant behoefte heeft aan proactievere en nauwkeurigere aankomsttijdinformatie. Daartoe zou de bezorgdheid van de LSP over mogelijk verlies van klanten worden weggenomen.

Door Nina Bussmann, Afstudeerder @ eMagiz

Twitter
LinkedIn
WhatsApp
Email