Glossika 語言實習生做什麼?

Hi! 我是 Derek,我在 Glossika 實習了四個月,在這裡來跟大家分享一下我在這期間的所見所聞和感想。如果你對語言學和寫程式有興趣,繼續往下看我們在 Glossika 做的事情!

到 Glossika 實習後才發現語言學原來能這樣應用

我就讀師大英語系,因為系上很重視語言學,而我在大學期間修了語言學各個領域的課程,也不知不覺就愛上語言學這個科目。語言學對我來說一直都是理論為重,進到 Glossika 之前我不知道語言學能有什麼實際應用,所以看到 Glossika 招募語言學實習生的時候,就來試試看了。

實習第一個月:團隊分工將語意分類

實習的第一個月,我做的是語意分類的工作。簡單來說就是先判斷一個字有什麼語意特性後,再把它標記相對應的符號,方便工程師利用這些符號幫句子分類。由於需要標記的語言資料數量非常多,有時候一個字甚至擁有很多不同的語意特性,標記的過程是很需要團隊合作的。

在 Glossika 實習的大家各個都是語言學好手,每次卡關,大家都能一起討論,一起解決問題。Glossika 的 CEO Mike 更是對語言學有強烈的熱情,與他討論我們遇到的問題時,他都會提出豐富的建議和想法讓我們參考,所以每次討論完,我們都能得到很大的收穫。

第二項任務:利用程式語言 Python 標記語意角色

語意分類工作結束後,我得到另一個任務:替句子進行語意角色標記。

語意角色標記是將一個句子中的各個語意角色,像是「Agent」、「Theme」 或「Beneficiary」還有核心動詞標記出來,這時候句法學上過的「thematic roles」就派上用場了。但 Glossika 團隊講求效率,因此我運用了程式語言 Python 進行語言處理。

實習前,我有學過基本的程式,但要分析語言,需要的是更專業的套件和有別於資料分析的演算法。為了達成這項任務,我在 Glossika 實習的期間學會了 Spacy 和 nltk 這兩種做自然語言處理的套件,另外也學會架 Google 的 API 等等。看似是一份簡單的工作,卻有很多的環節要處理。

在 Glossika 實習真的能把語言學的知識派上用場

在 Glossika 實習的過程中,我真的能將課堂上學到的「語意學」和「句法學」的知識實際應用在語料標記中,再搭配寫程式,我所學到的真的遠超乎我的想像。如果你對於語言學有熱忱,但是又不知道未來如何在工作上運用這些知識的話,到 Glossika 實習看看,你會大開眼界的!


延伸閱讀

  1. 【實習分享】'19 Glossika 語言學實習生經驗分享
  2. 【實習分享】'19 Glossika 語言學跨足行銷的實習生經驗分享
  3. 【實習分享】'19 Glossika 行銷實習生經驗分享
  4. 對教育新創團隊有興趣嗎?快加入 Glossika 和我們一起成長吧!