YAiTRON XSLT stylesheets

YAiTRON is a cleaned-up version of NECTEC’s LEXiTRON in a well-formed XML format, created by Vee Satayamas. Its tag names are TEI-inspired.

  • YAiTRON wiki – about YAiTRON and its XML structure
  • data: data-20070709release notes
  • extracted data: extracted-20070709 – word list extracted from data-20070709, one part-of-speech per each file
  • scripts: scripts-20070926 – scripts and XSLT stylesheets for YAiTRON data manipulation
  • Analysing LEXiTRON data files, with Ruby

    สุดสัปดาห์ที่ผ่านมา นั่งเรียน Ruby (กำลังฮิต mk ก็ทำอย่างเดียวกันโดยไม่ได้นัดหมาย)

    ตอนแรกว่าจะลอง Ruby on Rails เลย ..

    คืออาทิตย์ก่อนหน้านี้
    (สังเกต: ใช้คำว่าว่า อาทิตย์ก่อนหน้า แต่ก็ใช้ สุดสัปดาห์ … สุดอาทิตย์ ไม่มีใครใช้)
    นั่งเขียน ‘เว็บบอร์ด’ ใหม่อยู่ (โครงการพันล้าน ทำ ๆ รื้อ ๆ มาหลายชาติ ตอนนี้ Google ออกเบต้าไปเรียบร้อยแล้ว :P)
    ก็เขียนด้วย PHP ตามถนัดน่ะแหละ (ซึ่งผมว่า สำหรับเว็บเล็ก ๆ นะ PHP นี่แหละ เร็วสุดแล้ว หมายถึงสร้างนะ แต่ถ้าทำใหญ่ ๆ ก็รกง่ายมาก) แต่คราวนี้แทนที่จะทำอะไรเองหมด ก็ไปลองใช้พวกไลบรารีใน PEAR มั่ง
    ซึ่งก็ง่ายดี และทำให้โค้ดสะอาดขึ้นเยอะ (อย่างตัว MDB2 นี่ก็ชอบ .. ถ้ามันใช้ utf-8 ได้นะ) read more

    Lexical/Semantic Networks

    Sematic Networks

  • Mimida (many languages, including non-European ones)
  • EuroWordNet (Dutch, Italian, Spanish, German, French, Czech, Estonian)
  • MultiWordNet (Italian, English, Spanish, Hebrew)
  • WordNet (English)
  • TCL’s Computational Lexicon (Thai)
  • GermaNet (German)
  • WordNet for Hebrew
  • WordNet Domains each synset has been annotated with at least one domain label
  • Suggested Upper Merged Ontology (SUMO)
  • Global WordNet Association
  • read more