Web Graphs and P2P

Web Graphs

All people in computer science and some fields of engineering (e.g. industrial engineering?) are very familiar with “Graphs” — those nodes and arcs. And, actually, we can represent the web as a [huge] graph. Where node=webpage, arc=(hyper)link.

From this representation, it gives us a way to understand the characteristic of the web better (as we do well with normal graphs).

graph structure in the web | web graph | more on web graph


Talking about representing document/site as a node in a graph, Peer-to-Peer people already done this since their early day. read more

Summarization for Search Engine

Talking about Document Clustering/Categorization/Classification, about ‘approach’ to aid user access to mountains of pages may be a Summarization.

Instead of just only page title, url, and few first (nonsense) paragraphs from the page.

Short summaries may help users to decide which pages are whattheywant and whattheydontwant.

นอกจากจะแบ่งกลุ่มเอกสารที่หามาได้ ให้หา(ต่อโดยผู้ใช้ว่าอันไหนจะเอา อันไหนไม่เอา)ง่ายๆ แล้ว read more

Information Retrieval (and related) research groups in Thailand


จริงๆ Createch Club ก็ไม่ได้ตายหายจากไปไหนนะ
ยังมีน้องๆ เค้าสนใจทำกันอยู่เยอะ พวกรุ่นพี่ๆ อย่างพี่เป้ พี่สันต์ ก็ยังมาช่วยกันอยู่
(เค้าจบไปกี่ปีแล้วน่ะ 5 ปีได้ยัง จะ 6 แล้วมั้ง นั่นรุ่น 3 เลยนะ) read more

DNLG, SIIT, Createch

วันนี้ไปคณะ print papers ออกมา 4 เรื่อง (ของ DNLG ซะ 3, ของ NLSSD ซะ 1) .. ไม่รู้จะได้อ่านรึเปล่าน่ะสิ -_-”

คุยกับแอร์ (airuko) บ่นๆ เรื่องคะแนน assignment แรกที่มันได้น้อยจัง (62%)
คุยไปคุยมา ก็บอกไปว่าอยากกลับไปเป็นอาจารย์ที่ SIIT .. แอร์มันก็บอก ทำไมมีแต่คนคิดเหมือนกันนะ
ก็เลยคุยต่อเรื่องนี้ แล้วก็คุยไปถึงเรื่อง ม.ชินวัตร ที่ตอนนี้ ดร.เอกวิชญ์ ไปเป็น Dean (อันนี้แอร์บอกมา เพิ่งรู้เหมือนกัน ไม่รู้ว่าตั้งแต่เมื่อไหร่)
แต่ว่าก็ยังอยู่ที่ SIIT นะ ไม่ได้ไปไหน คืออยู่สองที่ .. ถ้าสถาบันเรามีทุนเยอะๆ มั่งก็คงดีนะ read more

Question Answering Systems

เมืองไทยมีที่ไหนทำ Question-Answering บ้างรึเปล่า?

มันก็ประมาณ Information Extraction อะไรประมาณนี้แหละ
ที่ TREC ก็มี QA Track ด้วย
ปีที่ผ่านมา (2003) ทีมจากมหาลัยของสิงคโปร์ (NUS) ได้ที่ 3 จากทีมทั้งหมดที่ร่วมประเมิน และเป็นที่ 1 ถ้านับเฉพาะสถาบันการศึกษา .. อันนี้พูดไปงั้นๆ แบบว่าเผื่อจะจุดประกายอะไรในเมืองไทยมั่ง 😛 read more


WhatWeWant is up online, thanks to keng. A blog about search engine, information retrieval, and those kind of stuffs.

My clothes are currently running around, play catching up each other in the washing machine.
It’s just almost 6am here, in Edinburgh. Still very dark. During this time of year, the Sun will rises on around 9am … and says bye-bye on around 4pm <gosh!> -_-“

Actually, just very lazy to woke up. But tomorrow 6pm I have to work at Thai restaurant, and my ‘uniform’ is not get washed yet. (Today I guess I will back to my flat late, have to finished practical part of my assignment — due tomorrow 5pm.) read more