Java DOM parser for real-world HTML


JTidy can be used as a tool for cleaning up malformed and faulty HTML. In addition, JTidy provides a DOM interface to the document that is being processed, which effectively makes you able to use JTidy as a DOM parser for real-world HTML.

เฮ้ อันนี้น่าสนใจ เผื่อเอามาดึงเว็บไปอ่านได้

HTML DOM นี่ไม่ค่อยเจอแฮะ หมายถึงที่เป็น API/lib ให้เอามาสร้างโปรแกรมได้น่ะ
เจอแต่ XML DOM แล้วถ้าเอกสารมันไม่ well-formed ก็มักจะมีปัญหา


One response to “Java DOM parser for real-world HTML”

  1. ของ php ก็มีเหมือนกันครับhttp://pear.php.net/package/XML_HTMLSax

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.