SUMMaR: Combining Linguistics and Statistics for Text Summarization

We describe a text summarization system that moves beyond standard approaches by using a hybrid approach of linguistic and statistical analysis and by employing text-sort-specific knowledge of document structure and phrases indicating importance. The system is highly modular and entirely XML-based so that different components can be combined easily.

Stede, Manfred, Heike Bieler, Stefanie Dipper, and Arthit Suriyawongkul (2006). SUMMaR: Combining Linguistics and Statistics for Text Summarization. In Proceedings of the 17th European Conference on Artificial Intelligence (ECAI-06), pp 827-828. Riva del Garda, Italy. [PDF]

SUMMaR งานจากปี 2006 ตอนอยู่พอตสดัม เดี๋ยวนี้ทำไม่เป็นแล้วล่ะ ตอนนั้นที่ทำเป็นประมาณ ดูโครงสร้างของเอกสาร หาโซนว่าตรงไหนน่าจะพูดถึงอะไร เอาตรงนี้มารวมกับสถิติคำ โครงการนี้เป็นส่วนหนึ่งของโครงการใหญ่ที่มีพาร์ตเนอร์จากภาคอุตสาหกรรมด้วย เป็นพวกสำนักพิมพ์ หนังสือพิมพ์

ตัวอย่างที่เอามาใช้ในชิ้นนี้ เป็นรีวิวหนัง เลือกเอา Good Bye Lenin! มาใส่ในโปสเตอร์อธิบายงาน :p

เมื่อก่อนแล็บชื่อ Applied Computational Linguistics Lab ตอนนี้เปลี่ยนเป็น Applied Computational Linguistics Discourse Research Lab ละ (ชื่อยาวมาก)

First day in Potsdam

Halo. Now in Haus 24, 1.82. Institut für Linguistik, Uni Potsdam.

I’m going to work in the Project SUMMaR.

From the project info page – “SUMMaR is part of the BMBF project PINK (‘Plattform fuer INtelligente Kollaborationsportale’), a consortium of companies and universities from Berlin-Brandenburg, funded in the framework ‘Innovative regionale Wachstumskerne’.”

Travel info, this morning: U9 (underground) from Leopoldplatz to Zoologischer Garten station, then RE1 (rail) for Potsdam Hbf, then Bus 606 for Golm Hbf, and walk into the campus.
Note: ‘Hbf’, short for Hauptbahnhof (English translation), is something like “central station / main station”.