Tuesday, September 22, 2009

程式設計也走混搭風!

最近一直在想一個問題,就是,語言學研究工作者,特別是從事語言資源建構與評估的人,應該如何去迎接一個新的時代。

先看看與所謂 Web 2.0 相關的概念:mashup 和 social networking applications。

Mashup (混搭) 的概念,一開始是來自流行音樂工業。混搭音樂作品,通常是由混合兩首以上的流行樂曲之樂器或演唱之音軌所組合而成。後來應用到網路上,輔以 google maps 的出現,成了當前火紅的一種概念與技術。

混搭應用在技術上的實踐,門檻不高,例如 Ajax (Asynchronous JavaScript And XML),許多非理工背景的人也都能很快即上手。這裡設計的是高度的網路創作想像力,很適合對數位實現有興趣的人文工作者。這也是當初我冒著不被諒解的風險,在台師大英語系開設語言學程式設計的理由。

讓我們回到語言學的幾個基本爭論點去想想:語料是什麼?語料與語言理論的關係是什麼?傳統的語料庫概念,文本封閉靜態,語言呈現類型單質,樣本亦常常欠缺說服力。我想像未來的語料庫應該是,在不斷演化的雲端中,提供不同面向的語言訊息(包括語料地理訊息、時間訊息、性別訊息、語音訊息、本體訊息等等),容許各種目的與觀點下的語料當下 (ad hoc) 運算,方便的工具與 API 介面讓語言研究者能立刻建立各種語料與理論模組。

至於社會網路,又是另一個相關的有趣語料來源。網路時代,讓我們得以協力生活與創作 (Folksonomy, Social Tagging ),不管參與者有無意識到這點!不論是 Facebook, MySpace 等社交網站,網誌或微網誌,不僅提供活生生的當代口語使用資料,更重要的是還有彼此相互連結的訊息。以前礙於語料而綁手綁腳的諸如 sublanguage, idiolect, domain ontology 等研究與應用,現在卻是等在那裡,讓有想像力的人可以大展宏圖。

一言難盡,果真是眾聲喧譁的年代已然來臨。