【Glossika 實習分享 | 研究開發小組】從熱愛英文到踏進語言學世界

抱著一顆熱愛英語的心加入 Glossika,卻一腳踏進了語言學的世界。

負責的專案項目每天早上 8:59 分,我與其他實習生一同前往老闆的辦公室,9 點準時進行 Stand-up Meeting。Stand-up Meeting 是每天早上 5–10 分鐘與老闆及其他實習生的極短會議,總結昨天工作項目的進度及報告今天的工作目標,確認 we’re on the same page,也可在這時候向老闆提出昨日遇到的疑問或困難。

“I did around 2,500 tokens yesterday, and I will continue doing the tokens today.”

這大概是我每天早上的報告內容,唯獨從 tokens 換成 frequencies 換成 levels 換成lemmas 又換成了 MWEs,每日完成數量也會有所起伏。那上述提到的一串英文字分別代表什麼意思呢,讓我們稍稍進入語言學的世界。

由於 Glossika 打造的新平台 Viva 旨在打造多種語言、系統化的完整資料庫,我們這些實習生的主要職責就是建立英文這個龐大的資料庫。最初輸入 140,000+ 的英語單字、片語,及其詞性、時態變化、單複數等,統稱為 tokens。隨即從頭到尾檢查Google sheet 上的 tokens 是否拼寫錯誤、漏標等。(這兩個步驟便花了我們整整一個月)。

資料庫的雛形是我們耗費心血輸入的那 14 萬 tokens(翻譯成中文才明白有多麽多XD),接下來的任務是將它們系統化,也就是標記它們的頻繁使用率(frequencies)—  是否為日常生活會用的字?還是艱澀、連母語人士都不知道的字?和難易程度(Levels),分成等級 1–12,1 是最簡單口語化的字,多數為常用的現在式動詞(ex: like, work);12 則是 technical word,可能是從事該專業領域才會曉得的 term(ex: hermaphrodite,意思是雌雄同體,btw)。

將 tokens 標上 level 目的在於使語言初學者有個明確的參考指標,一般來說大部分人會先從 level 低的單字學起 – 越口語、實用,隨著學習時間拉長、對於該語言有較好的掌握度再往較高 level 的字學。雖然我們善用 Google sheet 的公式整理、歸類、甚至演算出大量 tokens 的難易程度,但語言本身是一個相當主觀、且會因文化、時代、區域不同而相異的學問,因此還是得靠人力去檢查或判斷 tokens 的難易程度應該被歸在哪一個 level。

為了使每個 token 的 level 不會因人而異,我們構思並創立了一個參照表,每當對於某token 的 level 有歧異時,就以它當作標準降低人為誤差。

以上,大概就是我兩個月在 Glossika linguistics team 的實習內容,由上述可知,我們一天要處理幾千個 tokens,日積月累下來,這項職責培養我細心、謹慎的程度(雖然還是常常被老闆抓出 typo...)、大大擴充我的英語字彙量(每天 6hr plus 與英英字典為伍),此外,這是份較為靜態的工作,長時間久坐面對著 Google sheet 及密密麻麻的 tokens 考驗我的專注力及耐心持久度。

最後,這份實習也讓我重新思考自身對於語言的態度,我始終熱愛英語這個語言本身,也對我的英語程度相當有自信,但透過這份實習,我接觸到語言背後的邏輯與系統性歸類,雖然不能說讓我更愛英文(笑),卻替我打開了一扇通往更博大精深的英語世界的大門。

最寶貴的資產 

同屆實習生們由於最初的工作性質屬於獨立作業 — 大家各自輸入 tokens 到同一份Google sheet 當中,實習生們很晚才真正打成一片(也可能各位都是慢熟的氣質文青)。

以我自己來說,我是公司搬到 Wework、工作時與大夥兒坐在一起,有比較多機會與時間跟其他人互動,才逐漸熟悉彼此的。認識大家後,才驚覺大家各個身世背景不凡、臥虎藏龍!(其實很早從各位的談吐舉止就可以看得出來了,大家心知肚明,只是不點破)。但由於保護隱私以及我不想寫的太直白有失美感,我就大概描述一下我親愛的同事們、我們的互動日常、團隊合作型態,和我從他們身上學到的事。

我是 linguistics team 團隊中,年紀最小的實習生,但其他實習生們並不會因為年齡落差改變彼此溝通的方式,大家一律平等、擁有同等的發言權、表達機會,且一起討論工作內容、解決問題時也相互尊重、採納各方意見。有能力、有想法的人可以恣意拋出點子,看是否可行,可行的話就採用他/她的建議,卻不會功勞集結於一身,大家都有著這個專案是每個人付出心力完成的共識。

專案以外的日常互動當中,我從其他實習生身上學到了許多珍貴的特質,像是某個實習生就像是大家長一般,總是關照著團隊的每一個人,9:01 分有人還沒到公司便 line對方詢問;有人是每天午餐的外訂小天使,有人組織能力強、有條不紊,擔任傳遞老闆訊息的好幫手,有人鬼靈精怪點子多,總能迎刃而解專案上遇到繁瑣難解的問題。此外,對我來說另一個 bonus 是大部分的實習生都已大學畢業或出社會,社會歷練相對豐富,聽著他們分享自己過往經歷、職涯上的轉折、及價值觀是促使我對外來更加有想法的養分,每次他們娓娓道來自身、或身邊的人的故事,我都聽得津津有味。

Last but not least,我相信大家(包括我自己)都是因為喜愛英語而加入 Glossika,也因此,我覺得(也可能只有我自己這樣覺得)大家的頻率相近,感興趣的事物類似,彼此之間有特殊的默契。這種感覺有點微妙、難以言喻--我們之間相處輕鬆自在,甚至在一到五每天膩在一起 8 小時的情況下,星期六還是會約出來聚聚,這大概就是屬性相同的人傾向聚在一起的實際例子吧。(難得一見的好緣份啊 QAQ)

結語

我大學第一份實習就獻給 Glossika 了,對於第一次實習就能體驗到如此西式、探索性質高,意味著機會豐富、潛能無限的公司文化、遇到一群與自身同質性高的同事夥伴們、且在如此優質的工作環境裡悠遊,這般特殊的經歷,實屬難能可貴!

Glossika 教育新創團隊徵才中!

加入我們,與來自不同文化背景的團隊成員一起打造產品、解決問題,讓全世界的語言都能夠被學習和看見!