cpp/latest/_a2_c_trainer_8h_source.html

// Copyright (C) Entropy Software LLC - All Rights Reserved


#pragma once


#include "CuriosityModule.h"

#include "Object.h"

#include "RLTrainer.h"


namespace SmartEngine

{


#pragma pack(push, 4)

struct A2CTrainerCInfo : RLTrainerCInfo

{

    IGraph* graph = nullptr;


    ICuriosityModule* curiosityModule = nullptr; // Optional


    const char* valueNodeName = "";


    float valueCoefficient = 1.0f;


    float entropyCoefficient = 0.01f;


    int lookAheadSteps = 2;


    int minBatchSize = 32;

};

#pragma pack(pop)


class SMARTENGINE_EXPORT IA2CTrainer : public IRLTrainer

{

public:

    SMARTENGINE_DECLARE_CLASS(IA2CTrainer)


    virtual float GetPolicyLoss() = 0;


    virtual float GetValueLoss() = 0;


    virtual float GetEntropyLoss() = 0;

};


SMARTENGINE_EXPORT ObjectPtr<IA2CTrainer> CreateA2CTrainer(const A2CTrainerCInfo& cinfo);


extern "C"

{

    SMARTENGINE_EXPORT ObjPtr A2CTrainer_CreateInstance(const A2CTrainerCInfo& cinfo);

    SMARTENGINE_EXPORT float A2CTrainer_GetPolicyLoss(ObjPtr object);

    SMARTENGINE_EXPORT float A2CTrainer_GetValueLoss(ObjPtr object);

    SMARTENGINE_EXPORT float A2CTrainer_GetEntropyLoss(ObjPtr object);

}


} // namespace SmartEngine