Orange contribue à l’ingénierie linguistique
Deux nouvelles librairies étaient publiées au GitHub Orange-OpenSource: Lexical-corrector – une librairie C++ et un package java pour accès rapide au lexique et la correction (basée sur la distance de Levenshtein). Elle permets de definir la distance de Levenshtein en fonction de l’erreur typographique ( diacritique, lettres minuscules/capitales, touches voisines). Text-tokenizer – une librairie C++ […]