[regex-coach] Regular Expression Help

Jordan Marton jordan.marton at gmail.com
Fri Dec 29 16:08:39 UTC 2006


Hi guys. Hopefully someone can help me. I have the following chunk of
XML code. I need to extract the last section, from <w:p> to </w:p>
(inclusive) in the section that contains the [INTRODUCTION] text.

Here is my current attempt:
<w:p>.*(?=<w:t>).*(?=INTRODUCTION).*(?=</w:t>).*?</w:p>

Problem is, that regular expression grabs the entire chunk, not just
the last section. Can someone please advise.

<w:p>
  <w:pPr>
    <w:rPr>
      <w:rFonts w:ascii="Tahoma" w:h-ansi="Tahoma" w:cs="Tahoma"/>
      <wx:font wx:val="Tahoma"/>
      <w:sz w:val="20"/>
      <w:sz-cs w:val="20"/>
    </w:rPr>
  </w:pPr>
</w:p>

<w:p>
  <w:pPr>
    <w:rPr>
      <w:rFonts w:ascii="Tahoma" w:h-ansi="Tahoma" w:cs="Tahoma"/>
      <wx:font wx:val="Tahoma"/>
      <w:b/>
      <w:color w:val="000080"/>
      <w:sz w:val="40"/>
      <w:sz-cs w:val="40"/>
    </w:rPr>
  </w:pPr>
</w:p>

<w:p>
  <w:pPr>
    <w:rPr>
      <w:rFonts w:ascii="Tahoma" w:h-ansi="Tahoma" w:cs="Tahoma"/>
      <wx:font wx:val="Tahoma"/>
      <w:b/>
      <w:color w:val="000080"/>
      <w:sz w:val="40"/>
      <w:sz-cs w:val="40"/>
    </w:rPr>
    <w:t>Introduction</w:t>
  </w:pPr>
</w:p>

<w:p>
  <w:pPr>
    <w:rPr>
      <w:rFonts w:ascii="Tahoma" w:h-ansi="Tahoma" w:cs="Tahoma"/>
      <wx:font wx:val="Tahoma"/>
      <w:sz w:val="20"/>
      <w:sz-cs w:val="20"/>
    </w:rPr>
  </w:pPr>
  <w:r>
    <w:rPr>
      <w:rFonts w:ascii="Tahoma" w:h-ansi="Tahoma" w:cs="Tahoma"/>
      <wx:font wx:val="Tahoma"/>
      <w:sz w:val="20"/>
      <w:sz-cs w:val="20"/>
    </w:rPr>
    <w:t>[INTRODUCTION]</w:t>
  </w:r>
</w:p>



More information about the regex-coach mailing list