คำเชื่อม*
ซึ่ง และ โดย ถ้า แต่ หรือ คือ เช่น เมื่อ เพื่อ หาก เนื่องจาก แล้ว ทำให้ เพราะ ว่า สำหรับ ได้แก่ ดังนั้น โดยเฉพาะ อย่างไรก็ตาม
พวกนี้เอามาแบ่ง ประโยค (sentence) / อนุพากย์ (clause) ได้มั๊ย ?
* คำทั้งหมดได้มาจากคลังข้อความเอกสารด้านการแพทย์ที่แลบ เรียงตามความถี่ที่ปรากฎ – คำแรกพบบ่อยกว่าคำสุดท้ายเกือบ 11 เท่า
technorati tags:
Thai,
KIND,
connectives
3 responses to “connectives”
ผมว่าได้นะครับ ถ้าอยู่ใน corpus อยู่แล้ว ผมลองเอา acopost (pos tagger) มาตัดประโยตดูก็ไม่ค่อยจะดีเท่าไหร่ สงสัยต้องลองเอา คำก่อนหน้ามามาเป็น feature ด้วย เหมือน acopost จะใช้แต่ tag ก่อนหน้า? อนึ่งตัด clause อาจจะง่ายกว่า?
คำว่า "ว่า" กับ "หาก" อาจจะเป็นส่วนหนึ่งของคำอื่น?เช่น "กว่า" "มหากาพย์"
Oakyman: น่าจะตัดคำก่อน ตัดประโยค 🙂