Skip to content

bact' is a name

About
Courses
Media
Publications

Tag: search engines

hidden text in Kapook again

รู้จาก duocore.tv และตามไปอ่านในบล็อก mormmam และ pittaya เรื่องเดิม ๆ ครับ คล้าย ๆ กับที่เคยเป็นข่าวไปก่อนหน้านี้ กับการทำ search engine “optimization” Big blackhat SEO in thailand again (รูปภาพ นิกกี้ เพลย์บอย หนุ่มหล่อ ถ่ายแฟชั่น ยั่วน้ำลาย ชาวเกย์) Hidden text again (รูปภาพ Wonder Girls 5 สาวสวย ดาราเกาหลี) เท่าที่ดู คราวนี้นี่ไม่ได้เป็น spam เพราะว่าเนื้อหาก็ออกมาทำนองคำค้นพวกนั้น (ไม่เหมือนครั้งก่อน) แต่อย่างไรก็ตาม hidden text นี่มันก็ถือว่าเอาเปรียบเว็บไซต์อื่น ๆ เขา ในแง่ว่าไปดันอันดับคนอื่นในเสิร์ชเอนจิน (ไม่ได้ใช้ clear text เหมือนกันหมด แฟร์…

May 20, 2008
MSDN blogs on Nat Lang and Search

ทีมวิจัยพัฒนาของไมโครซอฟท์ ที่ทำด้านภาษาธรรมชาติในโปรแกรมออฟฟิศ และเครื่องมือค้นหาระดับองค์กร Microsoft Office Natural Language Team Blog คุณสมบัติที่เกี่ยวข้องในชุดออฟฟิศ ก็จะเป็นพวก ตัดคำ ใส่ยัติภังค์ (hyphenation) ตรวจและแนะนำตัวสะกด ตรวจและแนะนำไวยากรณ์ แปลภาษาอัตโนมัติ ย่อความอัตโนมัติ ค้นหาคำ Microsoft Enterprise Search Blog จะเป็นพวกคุณสมบัติการค้นหา ในโปรแกรมฝั่งเซิร์ฟเวอร์ เช่น Search Server, Office SharePoint, Windows SharePoint, Exchange Server, SQL Server รวมไปถึงการทำงานร่วมกับโปรแกรมของบริษัทอื่นด้วย เช่น Lotus Notes หรือการนำคอมโพเนนท์ที่เกี่ยวข้องของไมโครซอฟท์เอง มาให้บริการในสภาพการทำงานแบบองค์กร เช่น การนำเอา Virtual Earth Interactive Maps มาใช้ ใครสนใจก็ตามอ่านกันได้ครับ บานเลย – -“ โพสต์ที่น่าสนใจ เช่น…

April 25, 2008
Goliath vs Networked Davids

Goliath vs Networked Davids somewhat self-regulated Internet and power of grassroot reporters ? ข้างล่างเป็นเมลที่เพิ่งส่งออกไป ขี้เกียจจัดหน้า แปะมันงี้เลยละกัน จะนอนแล้ว เมื่อคนเล่นเน็ต/ผู้ใช้บริการ ตรวจสอบ เว็บไซต์/ผู้ให้บริการ ที่ทำผิด norm [บรรทัดฐาน] ของสังคมอินเทอร์เน็ต (แม้ว่าอาจจะไม่ผิดกฎหมายก็ตาม) ผมคิดว่าเรื่องเว็บไซต์ ไม่ใช่เรื่องน่าสนใจนัก (เว็บไซต์ประเภทนี้มีเยอะแยะ) เมื่อเทียบกับกระบวนการทั้งหมดที่ทำให้เรื่องมัน ‘แดง’ และ ‘ดัง’ ขึ้นมา ผมคิดว่ากระบวนการนี้น่าสนใจ จึงขอลำดับเหตุการณ์คร่าว ๆ ให้เพื่อน ๆ ได้ทราบกัน (กรุณาอ่านต่อในรายละเอียดต่อเองในแต่ละลิงก์ – ศัพท์บางคำอาจจะใหม่ แต่ไม่น่าจะยากเกินทำความเข้าใจ) ผมขอแสดงความเห็นในเรื่องนี้ก่อน ก่อนจะเข้าส่วนของลำดับเหตุการณ์: เรื่อง blackhat SEO, spamdexing เป็นเรื่องผิดมารยาทต่อผู้ประกอบการรายอื่น และละเมิดสิทธิในการรับรู้ข่าวสารที่มีคุณภาพของผู้ใช้อินเทอร์เน็ต — Google, Yahoo!, Microsoft…

March 22, 2008
xxx.kapook.com

This news in English: Blackhat SEO on Kapook.com, at Quando Omni Flunkus Moritati blog In Japanese 日本語: kapook祭り, タイだ。 เสาร์ 22 มีนา บ่ายโมง – Kapook ชวนคุยเรื่องนี้ @ บ้านไร่กาแฟ เอกมัย (BTS เอกมัย) pittaya เจ้าเก่าของเรา คุ้ยแคะแกะเว็บเอาเปรียบชาวบ้าน มาให้เราดูกันอีกแล้วครับ คราวนี้เป็นเว็บยอดฮิตซะด้วย… xxx.kapook.com จะเป็นยังไง ลองไปอ่านที่ pittaya เขียนไว้ดู ได้รู้ได้เห็นทั้งหมดแล้วก็ เฮ่อ… อีกแล้วหนอ… “คลิป sex xxx หนังโป๊ เรื่องเสียว” เหล่านี้ล้วนเป็นคำที่ติดอันดับการค้นหาสูงอันดับต้น ๆ ในประเทศไทย และมันก็ยั่วยวนเหลือเกิน ที่จะนำคำเหล่านี้มาใส่ไว้ในเว็บของตัว เพื่อหวังทำอันดับการค้นหาให้สูงขึ้น…

March 19, 2008
MySQL Thai full-text parser plug-in idea

MySQL 5.1 allows us to use a customized full-text parser. poakpong ถามเรื่อง fulltext ในฐานข้อมูล MySQL ว่าเอาไว้ทำอะไร ก็คือมันเอาไว้ระบุไว้ที่ช่องข้อมูล (field) ประเภทข้อความ (char, varchar, text) เพื่อบอกให้ MySQL มันทำดัชนี (index) สำหรับการค้นหาแบบ full-text search น่ะ ที่เคย ๆ เขียนกัน เวลาจะหาอะไรใน MySQL เราก็จะใช้ LIKE “%คำที่หา%” โดย LIKE มันจะวิ่งไปเปรียบเทียบข้อความในแต่ละช่องข้อมูล ทำนอง regular expression ส่วนกรณี full-text search ใน MySQL จะใช้คำสั่ง MATCH (ชื่อฟิลด์) AGAINST (คำที่หา) ซึ่งมันจะค้นจากดัชนีคำที่…

February 24, 2008
The $25,000,000,000 Eigenvector

บทความอธิบาย พีชคณิตเส้นตรง พีชคณิตเชิงเส้น สิ่งสำคัญของอัลกอริธึม PageRank ของ Google, โดย Kurt Bryan The $25,000,000,000 Eigenvector: The Linear Algebra Behind Google, in the Education section of the August 2006 issue of SIAM Review. This is a paper I wrote with Tanya Leise at Amherst College. It gives an undergraduate-oriented explanation of the beautiful and simple linear algebra that…

May 24, 2007
SWSE – Semantic Web Search Engine

เสริชเอนจินสำหรับ Semantic Web SWSE SWSE ออกเสียงเหมือน “swishy” โลโก้เป็นรูปเข็มทิศสองอัน ชี้ไปทางทิศตะวันตกเฉียงใต้ (SW) และตะวันออกเฉียงใต้ (SE) ทำลายสถิติโลก – สามารถค้นคำตอบจากประโยค RDF จำนวน 7 พันล้านประโยค ได้ภายในเสี้ยววินาที The Semantic Web Search Engine developed at DERI is able to answer queries with more than 7 billion RDF statements in fractions of a second – the largest number reported so far anywhere in the…

May 6, 2007
Longdo OpenSearch

Thai OpenSearch plugins นั่งทำอยู่ซักพัก เป็นปลั๊กอินเปิดพจนานุกรม Longdo โดยใช้ OpenSearch ลองทดสอบกันดูครับ มีแนะคำโดยใช้ Google Suggest ช่วยด้วย(!) ควรจะใช้งานได้กับทั้ง Mozilla Firefox 2 และ Internet Explorer 7 (ผมไม่ได้ลองกะ IE7) ไม่รู้ Opera ได้รึเปล่า สำหรับ Firefox 2 ตัวเบราว์เซอร์มันควรจะ detect ปลั๊กอินให้อัตโนมัติ ให้สังเกตว่ารูปแว่นขยายมันจะเปลี่ยนเป็นสีส้ม ๆ ลองกดดู จะมีคำว่า “Add Longdo” ให้เลือก (พี่อ็อท: ก็อปโค้ดไปแปะ HTML head ของเว็บ Longdo ได้เลยครับ อันนี้: <link rel=”search” title=”Longdo” href=”http://siit.net/members/art/searchplugins/longdo.xml” type=”application/opensearchdescription+xml”> ข้างล่างนี้คือเอกสารที่อ่านตอนทำ ตอนแรกงง ๆ…

July 19, 2006
OpenSearch

OpenSearch is a set of simple formats for the sharing of search results. Any website that has a search feature can make their results available in OpenSearch format. Other tools, like web browser integrated search service, can then read those search results. See what major browsers will do with this OpenSearch: Firefox 2, IE 7,…

June 4, 2006
Even Search Engine DO Politics

Kosmix is a topic-specific search engine, that gives you results in a particular viewpoint of your choice. Search for “global warming” in Politics, it will give you views of Libertarian, Liberal, and Conservative. The same goes for other two topics, Health (basic info, alternative medicine, diet & nutrition, etc.) and Travel (hotels, travels guides, museums,…

March 8, 2006

1 2 3

bact' is a name

Proudly powered by WordPress