Хобрук: Ваш путь к мастерству в программировании

Анализ рекурсивного XML с помощью XSL для создания файла csv

Вот пример XML-файла:

<PubmedArticleSet>
<PubmedArticle>
 <MedlineCitation Owner="NLM" Status="MEDLINE">
    <PMID Version="1">23458631</PMID>
    <DateCreated>
        <Year>2013</Year>
        <Month>04</Month>
        <Day>08</Day>
    </DateCreated>
    <MeshHeadingList>
        <MeshHeading>
            <DescriptorName MajorTopicYN="N">Animals</DescriptorName>
        </MeshHeading>
        <MeshHeading>
            <DescriptorName MajorTopicYN="N">Calcium</DescriptorName>
            <QualifierName MajorTopicYN="Y">metabolism</QualifierName>
        </MeshHeading>
        <MeshHeading>
            <DescriptorName MajorTopicYN="N">Calcium Chloride</DescriptorName>
            <QualifierName MajorTopicYN="N">administration &amp; dosage</QualifierName>
        </MeshHeading>
     </MeshHeadingList>
 </MedlineCitation>
</PubmedArticle>
<PubmedArticle>
 <MedlineCitation Status="Publisher" Owner="NLM">
    <PMID Version="1">23458629</PMID>
    <DateCreated>
        <Year>2013</Year>
        <Month>3</Month>
        <Day>20</Day>
    </DateCreated>
    <MeshHeadingList>
        <MeshHeading>
            <DescriptorName MajorTopicYN="N">Adolescent</DescriptorName>
        </MeshHeading>
        <MeshHeading>
            <DescriptorName MajorTopicYN="N">Adult</DescriptorName>
        </MeshHeading>
        <MeshHeading>
            <DescriptorName MajorTopicYN="N">Anthropometry</DescriptorName>
        </MeshHeading>
     </MeshHeadingList>
 </MedlineCitation>
</PubmedArticle>
</PubmedArticleSet>

Я хотел бы использовать XSL для анализа файла XMl и извлечения PMID, DateCreated, всех DescriptorName и MajorTopicYN для каждой статьи. Затем сохраните результат в файле csv, который выглядит так:

ArticleID|CreatedDate|MeSH|IsMajor
23458631|20130408|Animals|N
23458631|20130408|Calcium|N
23458631|20130408|Calcium Chloride|N
23458629|20130320|Adolescent|N
23458629|20130320|Adult|N
23458629|20130320|Anthropometry|N

Спасибо.

29.10.2013

  • Я не понимаю, при чем здесь рекурсивный бит. Я не вижу здесь рекурсии... 29.10.2013

Ответы:


1

Вот что вы хотите:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="text" version="1.0" encoding="UTF-8" indent="yes"/>

    <xsl:variable name="newline">
        <xsl:text>&#10;</xsl:text>
    </xsl:variable>

    <xsl:variable name="carriagereturn">
        <xsl:text>&#13;</xsl:text>
    </xsl:variable>

    <xsl:template match="@*|node()">
        <xsl:apply-templates select="@*|node()" />
    </xsl:template>

    <xsl:template match="/">
        <xsl:text>ArticleID|CreatedDate|MeSH|IsMajor</xsl:text>
        <xsl:value-of select="$carriagereturn" />

        <xsl:apply-templates select="@*|node()" />
    </xsl:template>

    <xsl:template match="DescriptorName">
        <xsl:value-of select="ancestor::MedlineCitation/PMID" />
        <xsl:text>|</xsl:text>

        <xsl:value-of select="ancestor::MedlineCitation/DateCreated/Year" />
        <xsl:value-of select="ancestor::MedlineCitation/DateCreated/Month" />
        <xsl:value-of select="ancestor::MedlineCitation/DateCreated/Day" />
        <xsl:text>|</xsl:text>

        <xsl:value-of select="." />
        <xsl:text>|</xsl:text>

        <xsl:value-of select="@MajorTopicYN" />

        <xsl:value-of select="$carriagereturn" />
    </xsl:template>
</xsl:stylesheet>

Удачи!

29.10.2013
  • Если я хочу обработать несколько файлов XML (одинаковая структура) и сохранить результат в одном и том же файле .txt. Что мне нужно изменить в файле xsl? 30.10.2013
  • Ничего. Думаю, вам следует изменить код, который дает xml в качестве входных данных для этого xslt и сохраняет выходные данные. 31.10.2013
  • Новые материалы

    ВЫ РЕГРЕСС ЭТО?
    Чтобы понять, когда использовать регрессионный анализ, мы должны сначала понять, что именно он делает. Вот простой ответ, который появляется, когда вы используете Google: Регрессионный..

    Не зря же это называют интеллектом
    Стек — C#, Oracle Опыт — 4 года Работа — Разведывательный корпус Мне пора служить Может быть, я немного приукрашиваю себя, но там, где я живу, есть обязательная военная служба на 3..

    LeetCode Проблема 41. Первый пропущенный положительный результат
    LeetCode Проблема 41. Первый пропущенный положительный результат Учитывая несортированный массив целых чисел, найдите наименьшее пропущенное положительное целое число. Пример 1: Input:..

    Расистский и сексистский робот, обученный в Интернете
    Его ИИ основан на предвзятых данных, которые создают предрассудки. Он словно переходит из одного эпизода в другой из серии Черное зеркало , а вместо этого представляет собой хронику..

    Управление состоянием в микрофронтендах
    Стратегии бесперебойного сотрудничества Микро-фронтенды — это быстро растущая тенденция в сфере фронтенда, гарантирующая, что удовольствие не ограничивается исключительно бэкэнд-системами..

    Декларативное и функциональное программирование в стиле LINQ с использованием JavaScript с использованием каррирования и генератора ...
    LINQ - одна из лучших функций C #, которая обеспечивает элегантный способ написания кода декларативного и функционального стиля, который легко читать и понимать. Благодаря таким функциям ES6,..

    Структуры данных в C ++ - Часть 1
    Реализация общих структур данных в C ++ C ++ - это расширение языка программирования C, которое поддерживает создание классов, поэтому оно известно как C с классами . Он используется для..