Skip to content

Latest commit

 

History

History
23 lines (18 loc) · 2.11 KB

quality-indicators.md

File metadata and controls

23 lines (18 loc) · 2.11 KB

Explication sur les indicateurs de qualité

Les indicateurs de qualité sont rassemblés sous le champ qualityIndicators.

Ces derniers contiennent des informations supplémentaires sur le contenu du fulltext et des métadonnées, calculé en amont de la chaîne. En effet, on y retrouvera :

Champs Type Détails
qualityIndicators {} Objet contenant l'ensemble des informations supplémentaires
qualityIndicators.abstractCharCount integer Nombre de caractères dans le résumé
qualityIndicators.abstractWordCount integer Nombre de mots dans le résumé (basé sur le nombre d'espace)
qualityIndicators.keywordCount integer Nombre de mots clés présents
qualityIndicators.pdfCharCount integer Nombre de caractères dans le PDF
qualityIndicators.pdfPageCount integer Nombre de pages du PDF
qualityIndicators.pdfPageSize string Taille des pages du PDF (format : "X x Y pts")
qualityIndicators.pdfVersion string Numéro de version du PDF
qualityIndicators.pdfWordCount integer Nombre de mots dans le PDF (basé sur le nombre d'espace)
qualityIndicators.refBibsNative boolean Indique si les références bibliographiques sont fournis par l'éditeur
qualityIndicators.score double Score de qualité, calculé selon les critères précédents (voir ici pour plus de détails)
qualityIndicators.tdmReady boolean Indique si le document a bénéficié d'un traitement spécifique pour un usage en fouille de textes. Si ce champ vaut true, alors le document est structuré et possède les champs table, figure et hasFormula

Ces informations sont extraites des métadonnées des fichiers, ou directement calculées par nos outils. Si un champ n'est pas renseigné pour un objet documentaire, cela signifie que cette information n'est pas disponible pour le moment.