【實習分享】'19 Glossika 暑期語言學實習生經驗分享:原來語言學可以這樣應用!
Glossika 語言實習生做什麼?
Hi! 我是 Derek,我在 Glossika 實習了四個月,在這裡來跟大家分享一下我在這期間的所見所聞和感想。如果你對語言學和寫程式有興趣,繼續往下看我們在 Glossika 做的事情!
到 Glossika 實習後才發現語言學原來能這樣應用
我就讀師大英語系,因為系上很重視語言學,而我在大學期間修了語言學各個領域的課程,也不知不覺就愛上語言學這個科目。語言學對我來說一直都是理論為重,進到 Glossika 之前我不知道語言學能有什麼實際應用,所以看到 Glossika 招募語言學實習生的時候,就來試試看了。
實習第一個月:團隊分工將語意分類
實習的第一個月,我做的是語意分類的工作。簡單來說就是先判斷一個字有什麼語意特性後,再把它標記相對應的符號,方便工程師利用這些符號幫句子分類。由於需要標記的語言資料數量非常多,有時候一個字甚至擁有很多不同的語意特性,標記的過程是很需要團隊合作的。
在 Glossika 實習的大家各個都是語言學好手,每次卡關,大家都能一起討論,一起解決問題。Glossika 的 CEO Mike 更是對語言學有強烈的熱情,與他討論我們遇到的問題時,他都會提出豐富的建議和想法讓我們參考,所以每次討論完,我們都能得到很大的收穫。
第二項任務:利用程式語言 Python 標記語意角色
語意分類工作結束後,我得到另一個任務:替句子進行語意角色標記。
語意角色標記是將一個句子中的各個語意角色,像是「Agent」、「Theme」 或「Beneficiary」還有核心動詞標記出來,這時候句法學上過的「thematic roles」就派上用場了。但 Glossika 團隊講求效率,因此我運用了程式語言 Python 進行語言處理。
實習前,我有學過基本的程式,但要分析語言,需要的是更專業的套件和有別於資料分析的演算法。為了達成這項任務,我在 Glossika 實習的期間學會了 Spacy 和 nltk 這兩種做自然語言處理的套件,另外也學會架 Google 的 API 等等。看似是一份簡單的工作,卻有很多的環節要處理。
在 Glossika 實習真的能把語言學的知識派上用場
在 Glossika 實習的過程中,我真的能將課堂上學到的「語意學」和「句法學」的知識實際應用在語料標記中,再搭配寫程式,我所學到的真的遠超乎我的想像。如果你對於語言學有熱忱,但是又不知道未來如何在工作上運用這些知識的話,到 Glossika 實習看看,你會大開眼界的!