如何計算和分析語言的難易度

討論「語言難易度」是很熱門的議題,相信大家也都常常在網路上看到許多相關的資訊圖表,但是這些資訊圖表可靠嗎?— 其實不然!很多資訊圖表都帶有主觀意識,譬如美國人覺得中文字好難,臺灣人覺得陰性陽性變化好複雜,受這些主觀偏見的影響,評斷語言的難易度也就連帶的不客觀。這篇文章將針對「評估語言難易度」和「世界上最難的語言」這兩個問題為主軸,客觀地用科學的角度分析,並且也各別以不同的母語來作為評斷標準。

用什麼方法能客觀分析語言的難易度?

我們先從主流學習的語言(像是法文、德文、西班牙文)以及普遍被西方人覺得困難的俄文、中文、日文開始討論起。我的看法可能跟其他人不同,譬如我覺得中文是很簡單的語言。但光是簡短的一句話其實並不能代表什麼,因為我沒有詳加解釋,而這也是網路資料最大的問題之一,就是不夠明確!就我目前學習過的語言來說,中文的文法真的非常簡單,但是句法和發音就是讓英語母語人士頭痛的地方了。但不管怎麼樣,這篇文章不帶對任何語言的偏見喔!

接下來,我會用三個關鍵和客觀的角度來分析,可能會出乎您意料之外的是書寫系統並不在我們的討論範圍內,因為書寫系統並非流利溝通的阻礙。

三個關鍵分別是:

  1. 字彙相關程度
  2. 句法和文法
  3. 音韻特色(語言的發音部位)

法文和德文普遍被認為比西班牙文難上許多,因為母音、子音多,加上法文的拼音複雜;也有人覺得法文和西班牙文的動詞變化不好掌握,原因是連音很多,而德文難的則是名詞變化。但是今天我們先不談這些,我們把焦點專注在發音。

對我來說,我最想從數據裡找到的東西是語言「相對難度」,尤其像波蘭文、匈牙利文、俄文、中文等這些總是被認為很難的語言當中,會不會有哪一個語言其實是算簡單的呢?結果可能會出乎您的意料!計算的邏輯是利用三個關鍵得出母語外語的數據,然後互相比較、彼此加減而成。

利用三個關鍵來計算語言的難易度指數比較客觀,但是前提是必須要有完整的語言研究資料才能有後續的計算。若有興趣瞭解語言的研究,可以到 WALS 線上資料庫 查找相關的訊息。那我們開始吧!

字彙彼此相關程度

  • 相同的語支:0 分
  • 不同的語支:1 分
  • 不同的分支:10 分
  • 不同的語系:100 分

全世界所有的語言都有其隸屬的語系,同一個語系的語言中,它們的單字都來自相同的源頭 -- 語系的祖語。舉例來說,英文屬於印歐語系,那同樣也屬於印歐語系的孟加拉語、俄文、亞美尼亞語、希臘文等都和英文一樣有同樣的字彙來源。這不是我個人的見解,這是事實!未來我也會寫一些相關的文章,跟大家分享如何利用語系的特色來記住不同語言的單字。

同一個語系裡的語言可以再被分成不同的層級和子群 (subgroups) ,但即便如此,同一語系、不同語言的單字仍循著同一個脈絡發展。日耳曼語系和羅曼語系的語言長期互相影響,使得彼此都有很多來自對方的外來語,因此我把日耳曼語系和羅曼語系視為一個大集合。英文是屬於日耳曼語系,受到羅曼語系的法文影響也很深遠,因此對於以英語為母語人士的學習者而言,德文和法文的難度都差不多,但是因為英文的口語比較偏向日耳曼語系;因而當他們在說其他日耳曼語系的語言時,其實會感覺好像在說英文一樣。因此在詞彙方面的評分,學習同語系的外語難度低,得 1 分,學不同語系的外語難度高,則得 10 分。

此外,英文很多高階的字都是從羅曼語系而來,因此與學習日耳曼語系的語言相比,學羅馬語系的語言就會比較困難,這樣的難度我給 5 分。至於學習完全不同語系的語言,譬如中文母語人士學法文或英文母語人士學日文、阿拉伯文,這樣的難度是 10 分。

語言的句法和文法

接下來這階段會有簡單的算數;因為每種語言的句法和文法結構都不相同,因此我們必須細分成各個面向來計算,不管是哪一個面向的計算,不是用算法 A 就是用算法 B,相當簡單易懂。

  • 算法 A:用外語分數扣掉母語分數,如果母語分數高於正在學的外語,那就是 0 分。舉例來說,中文母語人士 (1) 學德文 (3),其難易度就是相減之後的 2 分;德文母語人士 (3分) 學中文 (1),由於中文分數比德文低,因此我們以 0 分計算。
  • 算法 B:若母語和外語不屬同一類型,則以 1 分計算。
  1. 語言類型:孤立型(1 分)、黏著型(2 分)、屈折型(3 分)、多式綜合語(4 分)。採算法 A。
  2. 語序(SVO / SOV / VSO / VOS / OVS / OSV):採算法 B。
  3. 形容詞-名詞語序(形名 / 名形):採算法 B。
  4. 所有格-名詞語序(所名 / 名所):採算法 B。
  5. 限定詞-名詞語序(限名 / 名限):採算法 B。
  6. 關係子句-名詞語序(關名 / 名關):採算法 B。
  7. 名詞變格(名詞類別 x 格尾變化):採算法A。要注意某些語言的變格其實和後置詞的功能一樣(烏拉爾語系和阿爾態語系),這樣的情況下便不採計。
  8. 時態:採算法 A。
  9. 語體:採算法 A。
  10. 情態助動詞:因為語言中的情態助動詞不一致,因此我不計算這個部分,但是假設語氣會考量進去。
  11. 變位(動詞的字尾因人或數字而產生變化):採算法 A。
  12. 介詞(前置詞 / 環綴 / 後置詞 / 南島語系):採算法 B。

來看看幾個語言的數據:

語言類型語序形/名所/名限/名關/名名詞字尾變化時態語體動詞字尾變化介詞
阿拉伯文3VSO名形名所限名名關33214
德文3SOV形名名所限名名關4236
西班牙文3SVO名形名所限名名關0436
芬蘭文2SVO形名所名限名名關0226
法文3SVO名形所名限名名關0356
匈牙利文2SVO形名所名限名名關0246
日文2SOV形名所名限名關名5222
波蘭文3SVO形名所名限名名關21226
中文1SVO形名所名限名關名0040環綴

因此在「句法和文法」這個階段,我們可以計算出:

德文母語人士學法文的難易度是 6 分。

日文母語人士學西班牙文的難易度是 13 分。

中文母語人士學波蘭文的難易度是 34 分。


音韻特色

口腔的 12 個發音部位

每個語言會使用到的發音部位都不相同,譬如大部分的日文母語人士而言,捲舌音不存在日文裡,因此別的外語若有捲舌音,他們得花一些功夫學習。以發音部位計算語言難易度的方法同上,分別算出母語外語所需用到的發音部位;若外語的數字大於母語,則兩者相減;若外語的數字小於母語,則以 0 計算。

  • 唇音 Labials
  • 唇齒音 Labio-dentals
  • 齒間音 Dentals
  • 舌間前音 Alveolars
  • 舌葉音 Post-alveolars
  • 捲舌音 Retroflex
  • 舌面前音 Alveo-palatals
  • 舌面中音 Palatals
  • 舌背音 Velars
  • 小舌音 Uvulars
  • 喉壁音 Pharyngeals
  • 喉音 Glottal

來看看幾個語言的數據:

語言
音韻特色 (1/2)
唇音 唇齒音 齒間音 舌間前音 舌葉音 捲舌音 舌面前音
阿拉伯文21211100
德文4207400
西班牙文3272100
芬蘭文3014100
法文3206200
匈牙利文3209400
日文5007003
波蘭文3285045
中文3107043
語言
音韻特色 (2/2)
舌面中音 舌背音 小舌音 喉壁音 喉音 母音 聲調
阿拉伯文1512261
德文13201172
西班牙文3400051
芬蘭文12002161
法文14100162
匈牙利文62001141
日文2410152
波蘭文0900081
中文25000145

因此在「音韻特色」這個階段,我們可以得到這些結果:

德文母語人士學法文的難易度指數是 1 分。

日文母語人士學西班牙文的難易度指數是 11 分。

中文母語人士學波蘭文的難易度指數是 15 分。


世界上最難的語言是什麼?

書寫系統不是考量語言難易度的關鍵原因,因為如果有了書寫系統,那表示語言已經被「解碼」了。如果語言被解碼了,那幾乎一定會有字典,也表示這個語言沒那麼難!最難的語言應該要符合下列幾個特質:

  1. 沒有書寫系統(很多少數民族的語言或方言都沒有文字,例如歐洲吉普賽人講的 羅姆語 Romany
  2. 通常住在一般人難以接觸的地方(例如印度洋的北森蒂納爾島,居民講的是 桑提內爾語 Sentinelese
  3. 大量的音韻變化(例如 尤比克語 Ubykh 有高達 84 個子音)
  4. 多式綜合語(例如 格陵蘭語 Greenlandic貝拉庫拉語 Bella Coola
  5. 複雜的文法

前面說最難的語言應該要符合以上的特質,但世界上真的有這麼難的語言嗎?有的,就是第 4 點有提到、加拿大原住民所講的,屬於薩利希語系的貝拉庫拉語。

接下來下一篇文章,我們會以中文母語的角度實際計算外語的難度!

Foo

原文:Language Difficulty
中文編譯:Sheena Chen