{"id":965,"date":"2013-06-28T19:38:31","date_gmt":"2013-06-28T18:38:31","guid":{"rendered":"http:\/\/www.k-braungardt.de\/blogkb\/?p=965"},"modified":"2013-06-28T19:39:42","modified_gmt":"2013-06-28T18:39:42","slug":"html-parsen-teil-2","status":"publish","type":"post","link":"https:\/\/www.k-braungardt.de\/blogkb\/?p=965","title":{"rendered":"HTML parsen &#8211; Teil 2"},"content":{"rendered":"<p>Im gro\u00c3\u0178en und ganzen funktioniert es mit dem <a href=\"http:\/\/simplehtmldom.sourceforge.net\/\">HTML Simple DOM Parser<\/a>.<br \/>\nDurch LI-Tags ist mein Quelltext dann doch noch leicht strukturierter als urspr\u00c3\u00bcnglich gedacht. Jedes Item auf der untersten Ebene steckt innerhalb eines solchen, so dass ich die enthaltenen Elemente, auch die doppelten, einfach ansprechen k\u00c3\u00b6nnte. F\u00c3\u00bcr die doppelten funktioniert es nicht. i4 geht schon auf das n\u00c3\u00a4chste LI, obwohl ich ein bestimmtes LI anspreche. Gibt wom\u00c3\u00b6glich hier einen Denkfehler. Mein Modell war dieses hier aus der Doku gewesen:<\/p>\n<p><code>$e = $html->find('ul', 0)->find('li', 0);<\/code><\/p>\n<p> for($b=0; $b<$lizahl;$b++)\n       {\n       <code>\t$e = $item->find(&#8218;li&#8216;, $b);<br \/>\n             $i1= $e->find(&#8218;.item_1&#8216;,0)->plaintext;<br \/>\n              $i2= $e->find(&#8218;.item_2&#8216;,0)->plaintext;<br \/>\n$i3= $e->find(&#8218;.item_3&#8216;,0)->plaintext;<br \/>\n$i4= $e->find(&#8218;.item_3&#8216;,1)->plaintext;<\/code><br \/>\n}<\/p>\n<p>}<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Im gro\u00c3\u0178en und ganzen funktioniert es mit dem HTML Simple DOM Parser. Durch LI-Tags ist mein Quelltext dann doch noch leicht strukturierter als urspr\u00c3\u00bcnglich gedacht.&#8230;<\/p>\n<div class=\"more-link-wrapper\"><a class=\"more-link\" href=\"https:\/\/www.k-braungardt.de\/blogkb\/?p=965\">Weiterlesen<span class=\"screen-reader-text\">HTML parsen &#8211; Teil 2<\/span><\/a><\/div>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[30],"tags":[263,34,264],"class_list":["post-965","post","type-post","status-publish","format-standard","hentry","category-wissen","tag-parser","tag-php","tag-scraping","entry"],"_links":{"self":[{"href":"https:\/\/www.k-braungardt.de\/blogkb\/index.php?rest_route=\/wp\/v2\/posts\/965","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.k-braungardt.de\/blogkb\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.k-braungardt.de\/blogkb\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.k-braungardt.de\/blogkb\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.k-braungardt.de\/blogkb\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=965"}],"version-history":[{"count":2,"href":"https:\/\/www.k-braungardt.de\/blogkb\/index.php?rest_route=\/wp\/v2\/posts\/965\/revisions"}],"predecessor-version":[{"id":967,"href":"https:\/\/www.k-braungardt.de\/blogkb\/index.php?rest_route=\/wp\/v2\/posts\/965\/revisions\/967"}],"wp:attachment":[{"href":"https:\/\/www.k-braungardt.de\/blogkb\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=965"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.k-braungardt.de\/blogkb\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=965"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.k-braungardt.de\/blogkb\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=965"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}