Computer Vision : quel est le point commun entre le parsing de CV et votre aspirateur robot ?

22 septembre 2022
-
1272 Views

Ceux qui parmi vous possèdent un aspirateur robot savent qu'il a besoin de repères, tels que les murs invisibles ou des dispositifs plus sophistiqués pour ne pas foncer droit vers la panne ou l'accident.

Il en va de même des outils de parsing de CV. Pour distinguer les parties importantes d'un CV et éviter de passer à côté d'informations pertinentes, ces outils ont besoin de comprendre comment le candidat a structuré son document. Ce qui avec la part croissante de CV en colonnes et de CV graphiques n'est pas toujours évident.

Des CV de plus en plus sophistiqués 

Sur les CV d’un format classique, qui étaient la norme il y a une vingtaine d’années, cela se passe généralement très bien. Les modèles de traitement du langage naturel (NLP) basés sur une lecture linéaire du CV existent depuis longtemps et n’ont pas vraiment besoin de comprendre le document en détail.

Toutefois, les formats de CV d’aujourd’hui exigent généralement une approche plus sophistiquée. C’est notamment le cas des CV en colonnes, où les candidats utilisent des couleurs ou même des motifs pour faire ressortir différents aspects de leur profil professionnel.

C’est encore plus vrai avec les CV graphiques désormais courants dans certains domaines professionnels.

Pour pallier ces difficultés, différentes méthodes comme de repérer l’espacement plus important qui peut caractériser l’espacement entre 2 colonnes, permettent d’améliorer les performances des outils de parsing traditionnels. 

Combiner 2 formes d'IA pour une compréhension de haut niveau des CV

Computer vision : Une innovation technologique majeure 

Une nouvelle méthode qui combine l'analyse textuel à la vision par ordinateur (computer vision) apporte des résultats prometteurs. Combiner ainsi 2 formes d'IA permet de s'approcher du raisonnement humain.

Face à une mise en page sophistiquée notre cerveau commence à isoler des zones graphiquement cohérentes et il nous parait évident que les données contenues dans une zone doivent d'abord être lues isolément.

La vision par ordinateur apporte cette dimension graphique au parsing de CV et permet de meilleures performances sur les CV de style contemporain.

Malheureusement, cette approche coûte cher. Pour atteindre des performances satisfaisantes, il est en effet nécessaire d'utiliser du matériel beaucoup plus couteux que les systèmes conventionnels. Cela explique pourquoi cette solution n'est actuellement utilisée que par une poignée d'éditeurs innovants.

Mais à l’heure où la donnée est au cœur de nos décisions, investir dans la qualité de sa collecte semble primordial.

Fort heureusement, la recherche sur l'amélioration de l'efficacité des algorithmes et la réduction régulière du coût des matériels informatiques promettent de belles avancées dans le temps. 

Partager sur :