Category: Computational Linguistics

  • CFP: NLP for Under-Resourced Languages

    2nd Call for Papers for the Workshop NLP for Under-Resourced Languages Friday, 10 June 2005. Dourdan, France Held in conjunction with the TALN 2005 conference (6-10 June 2005) Linguistic work on these languages is often lacking, and must overcome a number of difficulties: the presence of many lexical alternatives multiple spellings for the same word…

  • ThaiWrap รุ่น 5

    (บล็อกเก่า ThaiWrap bookmarklet, Auto thaiWrap()) รายการเปลี่ยนแปลง: ตัวแบ่งคำ เปลี่ยนจาก <WBR> มาใช้ zero-width space (U+200B) แทน เนื่องจาก Opera ไม่รู้จัก <WBR> เพิ่มการตรวจเบราเซอร์ เพื่อข้ามการทำงานทั้งหมด ถ้าใช้ Internet Explorer (เหตุผล: 1. จะได้ไม่เสียเวลา เพราะ IE ตัดคำได้อยู่แล้ว 2. IE แสดงผล zero-width space ไม่ได้) ตอนนี้ยังเหลือปัญหา เรื่องไม่ทำงานกับเฟรมที่ซ้อนเฟรม ไล่ DOM reference ตะกี้นี้ เจอละว่ามันผิดตรงไหน (เราไปใช้ window.frames ซึ่งมันจะส่งค่ากลับเฉพาะ frames ระดับบนสุดเท่านั้น, คาดว่า. นอกจากนั้น มันยังไม่อยู่ใน spec ด้วย – อันตราย) แต่ยังไม่รู้จะแก้ไง…

  • Machine Translation links

    The European Association for Machine Translation The British Computer Society, Natural Language Translation Specialist Group

  • Oxford University Handbook of Computational Linguistics

    80 GBP !! Hmm.. better wait for a paperback version.

  • Open source translation tools

    กันลืม เห็น XLIFF มานานแล้ว แต่ก็อย่างที่ในบล็อกนั้นว่า มันยังไม่มี open source implementation เลย. นอกจากตัวนี้แล้วก็ยังมีมาตรฐานอื่นๆ ที่เกี่ยวข้องอีก เช่นมาตรฐานการเก็บคำศัพท์ (terminology) หรือ translation memory เพื่อที่จะได้เอามารีไซเคลใช้ได้อีก (จากโปรเจกต์นึงไปอีกโปรเจกต์นึง) ตัวที่เด่นๆ ก็คือ TMX. มาตรฐานพวกนี้ ซอฟต์แวร์ CAT (computer-assisted translation) อย่าง TRADOS สนับสนุนหมดทุกตัว แต่ก็ต้องเสียตังค์ซื้อน่ะ ไม่ใช่ถูก เดี๋ยวเอาไว้ค้นต่อ

  • จากข่าว ยกน้ำหนักหญิงไทย

    ก่อนอื่นก็ขอแสดงความยินดีด้วย กับทั้งทีมเลย ส่วนอันนี้จากข่าว ที่กรุงเทพธุรกิจ —- โฆษกประจำสำนักนายกรัฐมนตรี กล่าวว่า นายสุวัจน์ ยังได้ชี้แจงเกี่ยวกับข่าวที่เสนอว่าไปเอาเหรียญทองมาจากนางสาวอุดมพรมานั้น ความจริงคือนางสาวอุดมพร แจ้งต่อรองนายกรัฐมนตรีว่าอยากได้เหรียญที่เป็นทองคำแท้ จึงรับปากที่จะทำให้ โดยขอยืมเหรียญทองมาทำบล็อคในการทำเหรียญทองคำแท้ และจะส่งเหรียญตัวจริงกลับไป เพราะนางสาวอุดมพร จะต้องใช้ในการทำกิจกรรมต่าง ๆ อีก —- แจ้ง ต่อ รองนายกฯ แจ้ง ต่อรอง นายกฯ อืม…

  • 135 ปอนด์

    tutorial session, แพงจัง ไปดีมั๊ยเนี่ย SIGIR 2004

  • Thai Speech Processing Tutorial #2

    from thaispeech at yahoogroups com: —- Hello Thai speech members, I just launched the second tutorial (in Thai) focusing on the way to construct a N-gram model from a plain text on a domain of hotel reservation. The tutorial will bring newcomers closer to real applications of large vocabulary speech recognition. Please visit our home…

  • งานไม่เดิน

    ปัญหาที่พบขณะนี้ ข้อมูล – ข้อมูลที่เอามาใช้ ไม่มีคุณสมบัติบางอย่างที่ต้องการ แต่ไม่มีทางเลือกอื่นแล้ว เพราะว่า ข้อมูลชุดนี้ เป็นข้อมูลชุดเดียวที่มีคุณสมบัติหลักที่ต้องการ – อาจจะต้อง annotate คุณสมบัติที่ต้องการลงไป -> ปัญหา(อีก): 1) เวลา 2) เพื่อความน่าเชื่อถือ อาจจะต้องใช้คนทำมากกว่าหนึ่งคน การประเมินผล – ยังไม่มีวิธีการประเมินคุณภาพ “ย่อความ” ที่เป็นที่ยอมรับโดยทั่วไปในปัจจุบัน เนื่องจากสาขานี้ยังค่อนข้างใหม่ + มัน subjective – วิธีการประเมินผล ที่ใช้กันมากตอนนี้ ที่ยืมเอามาจากสาย IR คือ precision/recall, ไม่สามารถประเมิน คุณภาพ ที่เราต้องการพัฒนาได้ ยูโร 2004 – มีให้ดูทุกวันเลย เยี่ยมจริงๆ แต่เป็นปัญหานะ -_-“

  • master project step zero / ได้มาละ

    เมื่อคืนนั่งหา โถ มันก็อยู่ในเครื่องที่ตณะแค่นั้นเอง ใครๆ ก็เข้าไปโหลดได้ ไม่ยอมหาดีๆ มัวแต่เมลไปถามคนนั้นคนนี้ (แล้วก็ไม่มีใครตอบ หึหึ) ตกลงว่าได้มาแล้ว RST Discourse Treebank วันนี้คงต้องนั่งดู ว่าข้างในมีอะไรให้ใช้ได้บ้าง จะได้ไปคุยกะอาจารย์ได้ซักที มัวแต่ทำอะไรที่ไม่เกี่ยวกะเรียนมาหลายวันแล้ว -_-” เย็นนี้ 5 โมง ประกาศผลสอบ .. เดี๋ยวก็จะได้รู้ please