-
YAiTRON XSLT stylesheets
YAiTRON is a cleaned-up version of NECTEC’s LEXiTRON in a well-formed XML format, created by Vee Satayamas. Its tag names are TEI-inspired. YAiTRON wiki – about YAiTRON and its XML structure data: data-20070709 – release notes extracted data: extracted-20070709 – word list extracted from data-20070709, one part-of-speech per each file scripts: scripts-20070926 – scripts and…
-
Analysing LEXiTRON data files, with Ruby
สุดสัปดาห์ที่ผ่านมา นั่งเรียน Ruby (กำลังฮิต mk ก็ทำอย่างเดียวกันโดยไม่ได้นัดหมาย) ตอนแรกว่าจะลอง Ruby on Rails เลย .. คืออาทิตย์ก่อนหน้านี้ (สังเกต: ใช้คำว่าว่า อาทิตย์ก่อนหน้า แต่ก็ใช้ สุดสัปดาห์ … สุดอาทิตย์ ไม่มีใครใช้) นั่งเขียน ‘เว็บบอร์ด’ ใหม่อยู่ (โครงการพันล้าน ทำ ๆ รื้อ ๆ มาหลายชาติ ตอนนี้ Google ออกเบต้าไปเรียบร้อยแล้ว :P) ก็เขียนด้วย PHP ตามถนัดน่ะแหละ (ซึ่งผมว่า สำหรับเว็บเล็ก ๆ นะ PHP นี่แหละ เร็วสุดแล้ว หมายถึงสร้างนะ แต่ถ้าทำใหญ่ ๆ ก็รกง่ายมาก) แต่คราวนี้แทนที่จะทำอะไรเองหมด ก็ไปลองใช้พวกไลบรารีใน PEAR มั่ง ซึ่งก็ง่ายดี และทำให้โค้ดสะอาดขึ้นเยอะ (อย่างตัว…
-
Lexical/Semantic Networks
Sematic Networks Mimida (many languages, including non-European ones) EuroWordNet (Dutch, Italian, Spanish, German, French, Czech, Estonian) MultiWordNet (Italian, English, Spanish, Hebrew) WordNet (English) TCL’s Computational Lexicon (Thai) GermaNet (German) WordNet for Hebrew WordNet Domains each synset has been annotated with at least one domain label Suggested Upper Merged Ontology (SUMO) Global WordNet Association WordNet Interfaces…