如何計算和分析語言的難易度
討論「語言難易度」是很熱門的議題,相信大家也都常常在網路上看到許多相關的資訊圖表,但是這些資訊圖表可靠嗎?— 其實不然!很多資訊圖表都帶有主觀意識,譬如美國人覺得中文字好難,臺灣人覺得陰性陽性變化好複雜,受這些主觀偏見的影響,評斷語言的難易度也就連帶的不客觀。這篇文章將針對「評估語言難易度」和「世界上最難的語言」這兩個問題為主軸,客觀地用科學的角度分析,並且也各別以不同的母語來作為評斷標準。
用什麼方法能客觀分析語言的難易度?
我們先從主流學習的語言(像是法文、德文、西班牙文)以及普遍被西方人覺得困難的俄文、中文、日文開始討論起。我的看法可能跟其他人不同,譬如我覺得中文是很簡單的語言。但光是簡短的一句話其實並不能代表什麼,因為我沒有詳加解釋,而這也是網路資料最大的問題之一,就是不夠明確!就我目前學習過的語言來說,中文的文法真的非常簡單,但是句法和發音就是讓英語母語人士頭痛的地方了。但不管怎麼樣,這篇文章不帶對任何語言的偏見喔!
接下來,我會用三個關鍵和客觀的角度來分析,可能會出乎您意料之外的是書寫系統並不在我們的討論範圍內,因為書寫系統並非流利溝通的阻礙。
三個關鍵分別是:
- 字彙相關程度
- 句法和文法
- 音韻特色(語言的發音部位)
法文和德文普遍被認為比西班牙文難上許多,因為母音、子音多,加上法文的拼音複雜;也有人覺得法文和西班牙文的動詞變化不好掌握,原因是連音很多,而德文難的則是名詞變化。但是今天我們先不談這些,我們把焦點專注在發音。
對我來說,我最想從數據裡找到的東西是語言「相對難度」,尤其像波蘭文、匈牙利文、俄文、中文等這些總是被認為很難的語言當中,會不會有哪一個語言其實是算簡單的呢?結果可能會出乎您的意料!計算的邏輯是利用三個關鍵得出母語和外語的數據,然後互相比較、彼此加減而成。
利用三個關鍵來計算語言的難易度指數比較客觀,但是前提是必須要有完整的語言研究資料才能有後續的計算。若有興趣瞭解語言的研究,可以到 WALS 線上資料庫 查找相關的訊息。那我們開始吧!
字彙彼此相關程度
- 相同的語支:0 分
- 不同的語支:1 分
- 不同的分支:10 分
- 不同的語系:100 分
全世界所有的語言都有其隸屬的語系,同一個語系的語言中,它們的單字都來自相同的源頭 -- 語系的祖語。舉例來說,英文屬於印歐語系,那同樣也屬於印歐語系的孟加拉語、俄文、亞美尼亞語、希臘文等都和英文一樣有同樣的字彙來源。這不是我個人的見解,這是事實!未來我也會寫一些相關的文章,跟大家分享如何利用語系的特色來記住不同語言的單字。
同一個語系裡的語言可以再被分成不同的層級和子群 (subgroups) ,但即便如此,同一語系、不同語言的單字仍循著同一個脈絡發展。日耳曼語系和羅曼語系的語言長期互相影響,使得彼此都有很多來自對方的外來語,因此我把日耳曼語系和羅曼語系視為一個大集合。英文是屬於日耳曼語系,受到羅曼語系的法文影響也很深遠,因此對於以英語為母語人士的學習者而言,德文和法文的難度都差不多,但是因為英文的口語比較偏向日耳曼語系;因而當他們在說其他日耳曼語系的語言時,其實會感覺好像在說英文一樣。因此在詞彙方面的評分,學習同語系的外語難度低,得 1 分,學不同語系的外語難度高,則得 10 分。
此外,英文很多高階的字都是從羅曼語系而來,因此與學習日耳曼語系的語言相比,學羅馬語系的語言就會比較困難,這樣的難度我給 5 分。至於學習完全不同語系的語言,譬如中文母語人士學法文或英文母語人士學日文、阿拉伯文,這樣的難度是 10 分。
語言的句法和文法
接下來這階段會有簡單的算數;因為每種語言的句法和文法結構都不相同,因此我們必須細分成各個面向來計算,不管是哪一個面向的計算,不是用算法 A 就是用算法 B,相當簡單易懂。
- 算法 A:用外語分數扣掉母語分數,如果母語分數高於正在學的外語,那就是 0 分。舉例來說,中文母語人士 (1) 學德文 (3),其難易度就是相減之後的 2 分;德文母語人士 (3分) 學中文 (1),由於中文分數比德文低,因此我們以 0 分計算。
- 算法 B:若母語和外語不屬同一類型,則以 1 分計算。
- 語言類型:孤立型(1 分)、黏著型(2 分)、屈折型(3 分)、多式綜合語(4 分)。採算法 A。
- 語序(SVO / SOV / VSO / VOS / OVS / OSV):採算法 B。
- 形容詞-名詞語序(形名 / 名形):採算法 B。
- 所有格-名詞語序(所名 / 名所):採算法 B。
- 限定詞-名詞語序(限名 / 名限):採算法 B。
- 關係子句-名詞語序(關名 / 名關):採算法 B。
- 名詞變格(名詞類別 x 格尾變化):採算法A。要注意某些語言的變格其實和後置詞的功能一樣(烏拉爾語系和阿爾態語系),這樣的情況下便不採計。
- 時態:採算法 A。
- 語體:採算法 A。
- 情態助動詞:因為語言中的情態助動詞不一致,因此我不計算這個部分,但是假設語氣會考量進去。
- 變位(動詞的字尾因人或數字而產生變化):採算法 A。
- 介詞(前置詞 / 環綴 / 後置詞 / 南島語系):採算法 B。
來看看幾個語言的數據:
語言 | 類型 | 語序 | 形/名 | 所/名 | 限/名 | 關/名 | 名詞字尾變化 | 時態 | 語體 | 動詞字尾變化 | 介詞 |
---|---|---|---|---|---|---|---|---|---|---|---|
阿拉伯文 | 3 | VSO | 名形 | 名所 | 限名 | 名關 | 3 | 3 | 2 | 14 | 前 |
德文 | 3 | SOV | 形名 | 名所 | 限名 | 名關 | 4 | 2 | 3 | 6 | 前 |
西班牙文 | 3 | SVO | 名形 | 名所 | 限名 | 名關 | 0 | 4 | 3 | 6 | 前 |
芬蘭文 | 2 | SVO | 形名 | 所名 | 限名 | 名關 | 0 | 2 | 2 | 6 | 後 |
法文 | 3 | SVO | 名形 | 所名 | 限名 | 名關 | 0 | 3 | 5 | 6 | 前 |
匈牙利文 | 2 | SVO | 形名 | 所名 | 限名 | 名關 | 0 | 2 | 4 | 6 | 後 |
日文 | 2 | SOV | 形名 | 所名 | 限名 | 關名 | 5 | 2 | 2 | 2 | 後 |
波蘭文 | 3 | SVO | 形名 | 所名 | 限名 | 名關 | 21 | 2 | 2 | 6 | 前 |
中文 | 1 | SVO | 形名 | 所名 | 限名 | 關名 | 0 | 0 | 4 | 0 | 環綴 |
因此在「句法和文法」這個階段,我們可以計算出:
德文母語人士學法文的難易度是 6 分。
日文母語人士學西班牙文的難易度是 13 分。
中文母語人士學波蘭文的難易度是 34 分。
音韻特色
口腔的 12 個發音部位
每個語言會使用到的發音部位都不相同,譬如大部分的日文母語人士而言,捲舌音不存在日文裡,因此別的外語若有捲舌音,他們得花一些功夫學習。以發音部位計算語言難易度的方法同上,分別算出母語和外語所需用到的發音部位;若外語的數字大於母語,則兩者相減;若外語的數字小於母語,則以 0 計算。
- 唇音 Labials
- 唇齒音 Labio-dentals
- 齒間音 Dentals
- 舌間前音 Alveolars
- 舌葉音 Post-alveolars
- 捲舌音 Retroflex
- 舌面前音 Alveo-palatals
- 舌面中音 Palatals
- 舌背音 Velars
- 小舌音 Uvulars
- 喉壁音 Pharyngeals
- 喉音 Glottal
來看看幾個語言的數據:
語言 | |||||||
---|---|---|---|---|---|---|---|
唇音 | 唇齒音 | 齒間音 | 舌間前音 | 舌葉音 | 捲舌音 | 舌面前音 | |
阿拉伯文 | 2 | 1 | 2 | 11 | 1 | 0 | 0 |
德文 | 4 | 2 | 0 | 7 | 4 | 0 | 0 |
西班牙文 | 3 | 2 | 7 | 2 | 1 | 0 | 0 |
芬蘭文 | 3 | 0 | 1 | 4 | 1 | 0 | 0 |
法文 | 3 | 2 | 0 | 6 | 2 | 0 | 0 |
匈牙利文 | 3 | 2 | 0 | 9 | 4 | 0 | 0 |
日文 | 5 | 0 | 0 | 7 | 0 | 0 | 3 |
波蘭文 | 3 | 2 | 8 | 5 | 0 | 4 | 5 |
中文 | 3 | 1 | 0 | 7 | 0 | 4 | 3 |
語言 | |||||||
---|---|---|---|---|---|---|---|
舌面中音 | 舌背音 | 小舌音 | 喉壁音 | 喉音 | 母音 | 聲調 | |
阿拉伯文 | 1 | 5 | 1 | 2 | 2 | 6 | 1 |
德文 | 1 | 3 | 2 | 0 | 1 | 17 | 2 |
西班牙文 | 3 | 4 | 0 | 0 | 0 | 5 | 1 |
芬蘭文 | 1 | 2 | 0 | 0 | 2 | 16 | 1 |
法文 | 1 | 4 | 1 | 0 | 0 | 16 | 2 |
匈牙利文 | 6 | 2 | 0 | 0 | 1 | 14 | 1 |
日文 | 2 | 4 | 1 | 0 | 1 | 5 | 2 |
波蘭文 | 0 | 9 | 0 | 0 | 0 | 8 | 1 |
中文 | 2 | 5 | 0 | 0 | 0 | 14 | 5 |
因此在「音韻特色」這個階段,我們可以得到這些結果:
德文母語人士學法文的難易度指數是 1 分。
日文母語人士學西班牙文的難易度指數是 11 分。
中文母語人士學波蘭文的難易度指數是 15 分。
世界上最難的語言是什麼?
書寫系統不是考量語言難易度的關鍵原因,因為如果有了書寫系統,那表示語言已經被「解碼」了。如果語言被解碼了,那幾乎一定會有字典,也表示這個語言沒那麼難!最難的語言應該要符合下列幾個特質:
- 沒有書寫系統(很多少數民族的語言或方言都沒有文字,例如歐洲吉普賽人講的 羅姆語 Romany )
- 通常住在一般人難以接觸的地方(例如印度洋的北森蒂納爾島,居民講的是 桑提內爾語 Sentinelese )
- 大量的音韻變化(例如 尤比克語 Ubykh 有高達 84 個子音)
- 多式綜合語(例如 格陵蘭語 Greenlandic 和 貝拉庫拉語 Bella Coola )
- 複雜的文法
前面說最難的語言應該要符合以上的特質,但世界上真的有這麼難的語言嗎?有的,就是第 4 點有提到、加拿大原住民所講的,屬於薩利希語系的貝拉庫拉語。
接下來下一篇文章,我們會以中文母語的角度實際計算外語的難度!
原文:Language Difficulty
中文編譯:Sheena Chen