Bonjour, j’ai un ensemble de données avec les catégories dans une colonne et les valeurs dans une autre colonne. Chaque occurrence est listée l’une après l’autre. Par exemple :
Nom ; DUPONT
Prénom; PAUL
Pays: France
Nom ; DURAND
Prénom; PIERRE
Pays: ESPAGNE
Je souhaite placer la catégorie en tant qu’en-tête et chaque valeur sur une ligne distincte. J’ai utilisé le node Rule Engine pour définir la casse, et j’ai effectué un nœud de pivoting. En conséquence, j’ai mes catégories en tant qu’en-têtes, mais toutes les valeurs se trouvent dans la même ligne, séparées par des virgules. Comment puis-je mettre chaque occurrence sur une ligne distincte ?
Merci beaucoup. Je suis directement passé à l’étape du groupby car mes données étaient déjà structurées. Cependant, je me rends compte que l’exemple fourni n’était pas suffisamment détaillé. En effet, je peux avoir des séries avec des variables de longueurs variables. Reprenant l’exemple précédent, une personne pourrait être associée à deux ou trois pays, selon le cas. L’idée est de dupliquer les lignes pour une même personne tout en modifiant uniquement les champs qui diffèrent. Par exemple, nous pourrions avoir une troisième personne nommée MARTIN Eric intervenant en France et en Espagne. Le résultat attendu serait :
Martin Eric France …
Martin Eric Espagne …
Les trois petits points indiquent qu’il y a de nombreux autres champs qui peuvent eux-mêmes varier. Il est nécessaire de créer autant de lignes par personne qu’il y a d’occurrences différentes pour chaque champ.
cordialement
Je comprends que ma solution peut être améliorée. Ces exceptions peuvent être traitées séparément.
Si vous ajoutez votre workflow ou un petit exemple avec vos données, je peux essayer de vous aider.
Bonjour,
Voici mes données ; dans le cas précédent j’avais simplifié un exemple.
le code rubrique est sur la première colonne. les valeurs sont sur la deuxième.
chaque changement de personne est identifié par la rubrique S21.G00.30.001.
Sachant que toutes les informations sur la personne sont à la suite.
il me faut les rubriques en entêtes et les valeurs sur des lignes. il me faut autant de ligne par personne que les champs diffèrent. Surtout les deux rubriques S21.G00.78.002 et S21.G00.78.003 qui correspondent respectivement à la date de début de période et la date de fin de période.
Il s’agit en fait d’un extrait de fichier DSN envoyé aux organismes sociaux en France.
cordialement