U uputama je navedeno “Evaluacija rješenja radi se na slučajnom odabranom podskupu testnih primjera”.
Da li je podskup testnih primjera:
1) jednom generiran i taj isti se koristi u svakoj evaluaciji rješenja (isti se koristi za prvu, drugu, treću, … i desetu evaluaciju)?
2) generiran svaki put iznova za svaku evaluaciju rješenje (novi podskup se generira za svaki od maksimalno mogućih 10 evaluacija)?
Fiksirali smo podskup nad kojim se izvršava evaluacija za leaderboard na jedan određeni podskup vrijednosti od čitavog testnog skupa. Svi timovi dijele isti validacijski skup kako bi rangiranje na leaderboardu bilo vjerodostojno.
Broj 1) je točan odgovor.
Author
Posts
Viewing 1 reply thread
The forum ‘Forum za AI4Health.Cro 2024 izazov’ is closed to new topics and replies.