Paramètres avancés
Dans certains documents, les structures de table peuvent être complexes, s'étendant sur plusieurs lignes, contenant des informations regroupées ou incluant des lignes supplémentaires inutiles. Les Paramètres avancés en mode d'entraînement vous permettent d'affiner l'extraction de table pour de tels cas, améliorant ainsi la précision et la cohérence.
Pour accéder à ces paramètres, activez le Mode d'entraînement et cliquez sur l'icône d'engrenage Paramètres dans la barre d'actions supérieure :
Nombre de lignes d'en-tête
Utilisez ce paramètre pour définir le nombre de lignes constituant l'en-tête de la table.
Certaines tables ont des en-têtes sur plusieurs lignes. Par exemple, l'en-tête de cette table s'étend sur deux lignes :
Définissez le Nombre de lignes d'en-tête pour correspondre :
Pourquoi est-ce important ?
Si vous ne définissez pas cela, DocBits peut traiter la deuxième ligne comme des données au lieu de faire partie de l'en-tête, ce qui entraîne des erreurs d'extraction :
Avant :
Après :
Déplacer les lignes supplémentaires vers la corbeille
Utilisez ceci pour supprimer les entrées sur plusieurs lignes non désirées, telles que les descriptions débordantes.
Dans cet exemple, la description déborde sur plusieurs lignes, mais seule la première ligne est pertinente :
Activez Déplacer les lignes supplémentaires vers la corbeille pour supprimer le débordement :
Résultat après le mapping :
Nombre minimum de lignes regroupées
Utilisez ceci lorsque des lignes doivent être regroupées sous une ligne principale (par exemple, des éléments de ligne avec plusieurs sous-lignes).
Ici, seules trois lignes sur six sont pertinentes. Deux colonnes clés sont associées (par exemple, Position, Description), tandis que d'autres sont traitées comme des champs personnalisés.
Commencez par définir le Nombre de lignes d'en-tête et le Nombre minimum de lignes regroupées :
Activez également Déplacer les lignes supplémentaires vers la corbeille pour nettoyer les données non pertinentes :

Ensuite, définissez la colonne clé de regroupement, par exemple Position :
Résultat :
Regroupement inversé
Utilisez ceci lorsque la ligne de regroupement apparaît après les lignes qu'elle devrait regrouper.
Si la ligne qui devrait être regroupée avec d'autres données apparaît au-dessus de la clé de regroupement, activez cette option :
Activez le Regroupement inversé, regroupez par une colonne principale (par exemple, Montant net), et utilisez Déplacer les lignes supplémentaires vers la corbeille si nécessaire :
Résultat final :
Résumé
Utilisez les Paramètres avancés pour apprendre à DocBits comment gérer avec précision des structures de table plus complexes ou incohérentes. Ces paramètres améliorent la précision de l'extraction en tenant compte de :
En-têtes sur plusieurs lignes
Descriptions sur plusieurs lignes
Éléments de ligne regroupés
Ordre inverse des données regroupées
Activer ces options pendant l'entraînement garantit que DocBits se souvienne de la mise en page correcte pour les futurs documents du même fournisseur.
Last updated