agrad.cpp/main.cpp at main · HassanJbara/agrad.cpp · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
#include "agrad/Value.hpp"
#include "data/DataLoader.hpp"
#include "nn/MLP.hpp"
#include "nn/Visualization.hpp"

int main()
{
    // Load the dataset
    auto dataset = DataLoader::load_dataset("../data/moon_dataset.csv");

    // Split the dataset into training and validation sets
    auto [train_dataset, val_dataset] = DataLoader::train_test_split(dataset, 1.0, 0);

    std::cout << "Train dataset size: " << train_dataset.X.size() << std::endl;
    std::cout << "Validation dataset size: " << val_dataset.X.size() << std::endl;

    MLP model(2, {16, 16, 1}, false);

    int EPOCHS = 500;
    double LEARNING_RATE = 0.001;
    int BATCH_SIZE = 1;
    double epoch_loss = 0.0;
    double epoch_val_loss = 0.0;
    double accuracy = 0.0;
    int training_batches = train_dataset.X.size() / BATCH_SIZE;
    int validation_batches = val_dataset.X.size() / BATCH_SIZE;

    for (int i = 0; i < EPOCHS; i++)
    {
        epoch_loss = 0.0;
        epoch_val_loss = 0.0;
        accuracy = 0.0;

        for (int j = 0; j < training_batches; j++)
        {
            std::vector<std::vector<double>> batch_samples_x(train_dataset.X.begin() + (j * BATCH_SIZE), train_dataset.X.begin() + (j * BATCH_SIZE) + BATCH_SIZE);
            std::vector<double> batch_samples_y(train_dataset.y.begin() + (j * BATCH_SIZE), train_dataset.y.begin() + (j * BATCH_SIZE) + BATCH_SIZE);

            // Forward pass
            auto y_pred = model(batch_samples_x);

            // Compute loss and accuracy
            Value::ValuePtr loss = Value::create(0.0);

            for (size_t z = 0; z < BATCH_SIZE; z++)
            {
                loss = loss + (y_pred[z] - Value::create(batch_samples_y[z]))->pow(2);
                accuracy += (y_pred[z]->getData() > 0.5) == (batch_samples_y[z] == 1);
            }

            // Backward pass
            model.zero_grad();
            loss->backward();
            epoch_loss += loss->getData();

            // Update parameters
            for (auto &param : model.parameters())
            {
                param->setData(param->getData() - LEARNING_RATE * param->getGrad());
            }
        }

        // Validation
        for (int j = 0; j < validation_batches; j++)
        {
            std::vector<sample> batch_samples;
            for (int z = 0; z < BATCH_SIZE; z++)
            {
                batch_samples.push_back({val_dataset.X[j * BATCH_SIZE + z], val_dataset.y[j * BATCH_SIZE + z]});
            }

            // Forward pass
            std::vector<Value::ValuePtr> y_pred;
            for (auto &sample : batch_samples)
            {
                y_pred.push_back(model(sample.x)[0]);
            }

            // Compute loss
            Value::ValuePtr loss = Value::create(0.0);

            for (size_t z = 0; z < BATCH_SIZE; z++)
            {
                loss = loss + (y_pred[z] - Value::create(batch_samples[z].y))->pow(2);
                accuracy += (y_pred[z]->getData() > 0.5) == (batch_samples[z].y == 1);
            }

            epoch_val_loss += loss->getData();
        }

        epoch_loss /= training_batches;
        epoch_val_loss /= validation_batches;
        accuracy = (accuracy / dataset.X.size()) * 100.0;

        std::cout << "Epoch[" << i << "]: " << epoch_loss << ", Val: " << epoch_val_loss << ", Acc: " << accuracy << "%" << std::endl;
    }

    // Visualize the decision boundary
    auto predict_fn = [&model](double x1, double x2) -> int
    {
        return model({x1, x2})[0]->getData() > 0;
    };

    DatasetVisualizer::visualize_with_decision_boundary(dataset, predict_fn);

    return 0;
}