可以将多代理增强学习通过匹配订单与车辆分布用于搭车订单派发。可以获得信息。该信息可以包括多个车辆的多个车辆位置、多个搭车订单和当前时间。可以将所获得的信息输入到训练的模型中。训练的模型可以基于Kullback‑Leibler散度优化和联合策略指导下的独立代理。可以生成多个车辆要完成的多个订单派发任务。

    Multi-agent reinforcement learning may be used for rider order-dispatching via matching the distribution of orders and vehicles. Information may be obtained. The information may include a plurality of vehicle locations of a plurality of vehicles, a plurality of ride orders, and a current time. The obtained information may be input into a trained model. The trained model may be based on Kullback-Leibler divergence optimization and independent agents under a guidance of a joint policy. A plurality of order-dispatching tasks may be generated for the plurality of vehicles to fulfill.


    Zugriff

    Download


    Exportieren, teilen und zitieren



    Titel :

    通过订单车辆分布匹配以订单派发的多代理增强学习


    Erscheinungsdatum :

    2023-05-30


    Medientyp :

    Patent


    Format :

    Elektronische Ressource


    Sprache :

    Chinesisch


    Klassifikation :

    IPC:    G08G Anlagen zur Steuerung, Regelung oder Überwachung des Verkehrs , TRAFFIC CONTROL SYSTEMS / G01C Messen von Entfernungen, Höhen, Neigungen oder Richtungen , MEASURING DISTANCES, LEVELS OR BEARINGS / G05D SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES , Systeme zum Steuern oder Regeln nichtelektrischer veränderlicher Größen / G06N COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS , Rechnersysteme, basierend auf spezifischen Rechenmodellen / G06Q Datenverarbeitungssysteme oder -verfahren, besonders angepasst an verwaltungstechnische, geschäftliche, finanzielle oder betriebswirtschaftliche Zwecke, sowie an geschäftsbezogene Überwachungs- oder Voraussagezwecke , DATA PROCESSING SYSTEMS OR METHODS, SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL, SUPERVISORY OR FORECASTING PURPOSES