Langages

  1. TimeStress est un ensemble de données conçu pour évaluer la représentation temporelle des faits dans les grands modèles linguistiques (LLM) en évaluant leur capacité à distinguer les énoncés factuels corrects et incorrects contextualisés avec une date et formatés sous forme de questions, telles que « En 2011, qui était le président des États-Unis ? Barack […]

  2. Microtune est un agent autonome, qui contrôle dynamiquement la taille du cache mémoire utilisé par une base de données relationnelle (testé sur MariaDB). Son objectif (FinOps) est de réduire au maximum l’empreinte mémoire tout en respectant une contrainte de latence maximum à ne pas dépasser. Cet agent travaille de manière externe à la base de […]

  3. Compose est une application, qui permet de gérer le cycle de vie d’applications décentralisées. Cela comprend la conception et le déploiement de ces applications, ainsi que la gestion des interactions avec elles. Compose peut être déployé au-dessus de différents réseaux Blockchain (par exemple, Ethereum, Alastria, Arbitrum). Il est possible de concevoir directement un smart contract […]

  4. Ce projet fournit un pipeline automatisé pour générer des contrats intelligents (smart contracts) en utilisant de grands modèles de langage avec Ollama. Le pipeline compile ces contrats intelligents avec le compilateur Solidity (solc), les analyse avec Slither, et effectue des tests unitaires basés sur les instructions de test fournies dans les prompts. Des statistiques sont […]

  5. PowerDNS-Operator est un opérateur Kubernetes qui facilite la gestion des ressources PowerDNS, y compris les zones et les ensembles d’enregistrements (RRsets), grâce à l’utilisation de ressources personnalisées. Son objectif principal est de maintenir l’état de configuration souhaité de PowerDNS. Cet opérateur est spécifiquement conçu pour offrir des capacités DNS en tant que fonctionnalité en libre-service. […]

  6. WikiFactDiff est un jeu de données conçu pour la mise à jour atomique des connaissances factuelles dans les modèles de langue, et ce, dans le but de les aligner avec les connaissances actuelles. Il décrit l’évolution des connaissances factuelles entre deux dates, nommées T_old et T_new,​ sous forme de triplets sémantiques. Pour permettre la possibilité […]

  7. L’apprentissage automatique, dans les différentes tâches allant de l’entraînement à l’inférence, peut être très gourmand en énergie et soulève des préoccupations environnementales croissantes. Cette situation a inspiré différentes initiatives favorisant une IA plus frugale et plus verte. Au-delà de la mise en œuvre de bonnes pratiques, il apparaît crucial pour les chercheurs et data engineers […]

  8. Marine Detect est un projet innovant qui s’appuie sur la technologie du Deep Learning pour faire progresser la détection et l’identification d’espèces marines. Ces modèles ont été développés dans le cadre du projet Let’s Revive en partenariat avec Tēnaka. Tēnaka accorde une grande importance à la mesure de l’impact à travers Tēnaka Science, une plateforme […]

  9. 3D Gaussian Splatting est un nouvel algorithme pour reconstruire des scènes 3D photo-réalistes à partir de jeux d’images 2D. Cet algorithme a été développé en 2023 par l’INRIA à Sophia Antipolis. Il est devenu en quelques mois la référence dans le domaine. Cette solution se décompose en 2 parties : un outil pour entraîner les scènes […]

    CC++IA

    Publié le

  10. Les modèles de traitement de la parole sont souvent gourmands en ressources computationnelles, ce qui a des impacts environnementaux importants. En cause, des consommations énergétiques trop élevées pendant leur entraînement. ESSL (ou Apprentissage Auto-Supervisé Efficient en français) est un modèle de traitement de la parole proposé pour faire face à ce défi. Il permet une […]