BEST จัด “แข่งขัน” ซอฟต์แวร์ตัดคำไทย
ประโยชน์ของการแข่งขันนี้ นอกจากด้านซอฟต์แวร์แล้ว ยังมีเรื่องของการพัฒนาคลังข้อความ (corpus) และค้นหาความหมายของสิ่งที่เรียกว่า “คำ” ในภาษาไทยอีกด้วย
ครั้งนี้เล่นที่คำ ครั้งหน้าทีมงานวางแผนจะเล่นที่ “ประโยค”
อย่างไรก็ดี ผมว่าที่อาจารย์วิโรจน์ อักษรจุฬาฯ เสนอว่า ภาษาไทยอาจจะไม่มีประโยคก็ได้ ก็ดูเข้าที
สนใจดูได้ที่บทความ
Wirote Aroonmanakun, Thoughts on Word and Sentence Segmentation in Thai, SNLP 2007.
technorati tags:
computational linguistic,
word segmentation,
Thai language