David Monniaux on Nostr: Je crois que mon benchmark programmation pour les IA est "écrivez moi un script qui ...
Je crois que mon benchmark programmation pour les IA est "écrivez moi un script qui extrait de HAL le nombre de publications de Verimag entre 2019 et 2024 et parmi celles-ci celles avec un coauteur ou une coautrice à l'étranger".
Ça l'air bête mais purée ça envoie dans les choux Mistral AI pro.
L'autre benchmark est "Qui est David Monniaux?" (on me dit enseignant-chercheur à Saclay, Marseille, Lyon…).
Published at
2026-03-10 19:35:21 UTCEvent JSON
{
"id": "7d5494b56cb1089eec42cc3b54ad8ae4d0c96ee10f1e2c62813d593baa702af3",
"pubkey": "25d68d5267a2112d350066d6bc18c245ad7af5ebf31a3a00a9dd56921b9e1f92",
"created_at": 1773171321,
"kind": 1,
"tags": [
[
"proxy",
"https://social.sciences.re/@MonniauxD/116206555726992611",
"web"
],
[
"proxy",
"https://social.sciences.re/users/MonniauxD/statuses/116206555726992611",
"activitypub"
],
[
"L",
"pink.momostr"
],
[
"l",
"pink.momostr.activitypub:https://social.sciences.re/users/MonniauxD/statuses/116206555726992611",
"pink.momostr"
],
[
"-"
]
],
"content": "Je crois que mon benchmark programmation pour les IA est \"écrivez moi un script qui extrait de HAL le nombre de publications de Verimag entre 2019 et 2024 et parmi celles-ci celles avec un coauteur ou une coautrice à l'étranger\".\n\nÇa l'air bête mais purée ça envoie dans les choux Mistral AI pro.\n\nL'autre benchmark est \"Qui est David Monniaux?\" (on me dit enseignant-chercheur à Saclay, Marseille, Lyon…).",
"sig": "6b81160c240ee91b8f07340789771a8271f4145c7a932bb561208210a5084d599cc8d68d1a86f2df4b101a6e298ca26b5de41cec4adaa2450cb00127c6e5d870"
}