-
Ruby gsub, friends and unrelated stuffs
เราเรียกใช้เมทธอด gsub ของคลาส String (String#gsub) ใน Ruby ได้สองแบบ จาก API doc: คำสั่ง => ผลลัพธ์ str.gsub(pattern, replacement) => new_str str.gsub(pattern) {|match| block } => new_str ตรง pattern นี่ จะเป็น String ธรรมดา ๆ ก็ได้ เค้าให้ตัวอย่างมาแบบนี้ “hello”.gsub(/[aeiou]/, ‘*’) #=> “h*ll*” “hello”.gsub(/([aeiou])/, ‘<\1>’) #=> “h<e>ll<o>” “hello”.gsub(/./) {|s| s[0].to_s + ‘ ‘} #=> “104 101 108 108 111 ” แบบ…
-
Thai full-text search in MySQL – Draft Propsal
สถาบันส่งเสริมการจัดการความรู้เพื่อสังคม (สคส.) กำลังจะให้ทุนเพื่อพัฒนาความสามารถในการค้นหาข้อความภาษาไทย (Thai full-text search) ในระบบฐานข้อมูลโอเพนซอร์ส MySQL โดยมีงบประมาณ 200,000 บาท โดยตอนนี้ มีร่างข้อเสนอสำหรับโครงการแล้ว และคณะทำงานเห็นว่า น่าจะรับฟังความเห็นของสาธารณะเสียหน่อย เกี่ยวกับร่างข้อเสนอนี้ ใครสนใจ ก็ลองอ่านดู แล้วแสดงความคิดเห็นกันได้ที่เว็บบอร์ด LTN ห้อง General ที่กระทู้นี้ครับ — ขอบคุณครับ 🙂
-
Emdros – a database engine for annotated text
เมื่อคืนวีร์พูดถึง Emdros ว่าน่าสนใจ สำหรับงานฐานข้อมูลทางภาษาศาสตร์ ก็เลยเข้าไปดูเว็บซะหน่อย Emdros is: an opensource text database engine for storage and retrieval of analyzed or annotated text. applicable especially in corpus linguistics and computational linguistics. equiped with a powerful query-language MQL, based on the Extended MdF mathematical model of text. A short paper explaninig Emdros. ข้างบนจะเห็นคำว่า Extended MdF หรือที่ในเว็บ Emdros จะใช้คำว่า…
-
ThaiWrap รุ่น 5
(บล็อกเก่า ThaiWrap bookmarklet, Auto thaiWrap()) รายการเปลี่ยนแปลง: ตัวแบ่งคำ เปลี่ยนจาก <WBR> มาใช้ zero-width space (U+200B) แทน เนื่องจาก Opera ไม่รู้จัก <WBR> เพิ่มการตรวจเบราเซอร์ เพื่อข้ามการทำงานทั้งหมด ถ้าใช้ Internet Explorer (เหตุผล: 1. จะได้ไม่เสียเวลา เพราะ IE ตัดคำได้อยู่แล้ว 2. IE แสดงผล zero-width space ไม่ได้) ตอนนี้ยังเหลือปัญหา เรื่องไม่ทำงานกับเฟรมที่ซ้อนเฟรม ไล่ DOM reference ตะกี้นี้ เจอละว่ามันผิดตรงไหน (เราไปใช้ window.frames ซึ่งมันจะส่งค่ากลับเฉพาะ frames ระดับบนสุดเท่านั้น, คาดว่า. นอกจากนั้น มันยังไม่อยู่ใน spec ด้วย – อันตราย) แต่ยังไม่รู้จะแก้ไง…