【語言學習】網路上的語言學習資源
除了囤積一大堆紙本書、從圖書館影印一大堆資料來讀之外,我們也經常利用下列的網站與線上資源來學習及研究語言。相信這些能幫助到許多讀者,尤其是那些積極鑽研語言學的人。
語言學相關
語言描述
機器翻譯
地圖與媒體的樂趣
音位學
皮欽語(Pidgins)與克里奧爾語(Creoles)等語言
閱讀工具
語意學、語料庫與語源學
句法學
逐字稿工具
語言類型學
語言
非洲語言
阿爾泰語系
非阿爾泰語系語言
亞非語系
美洲語言
澳洲語言
南島語系
非洲語言
- 班圖語基礎字彙
- 非洲語言中的代名詞
- 非洲語言參考辭典(RefLex 計畫旨在建立非洲語言的參考詞彙語料以及其分析處理工具予科學研究社群)
- Glossika 史瓦希里語
- 祖魯語網站(一進入網站就會有歌聲)
阿爾泰語系
非阿爾泰語系
- 日語動詞手冊 (收錄一千個日語檢定 JLPT 中最常見的動詞)
- Glossika 日文
- Glossika 韓文
亞非語系
美洲語言
- 卡多語語料 (印第安那大學建立)
- 南美當地語言架構(SAILS)
- 南美語言與文化(連結百種語言資源)
- 南美語言音韻清單 (加州大學柏克萊分校建立;供語言研究與教育使用。可以透過地圖瀏覽、語言清單與音韻查詢連結到特定語言的音韻清單。)
澳洲語言
- 澳洲原住民語資料庫(AUSTLANG)
南島語系
台灣南島語族(福爾摩沙語)
菲律賓語族
馬來─玻里尼西亞語族
- 峇里語辭典資源
- 印尼語辭典資源
- Glossika 印尼語
- 爪哇語辭典資源
- 馬來語辭典資源
- 萬那杜與大洋洲語言資源(集結大量 Alexandre François 的田野調查記錄與可供下載的線上語言資源)
大洋洲與玻里尼西亞語言
印歐語系
- 早期歐洲語言(德州大學建立:集結從古到今所有歐洲語言文法)
- 歐洲國會平行語料庫(Parallel Corpus;多語言平行對照)
- 印歐語系同源語彙資料庫
- 印歐語系語彙網
- 原始印歐語言(PIE)基礎音素清單與發音法則
- 原始印歐語語彙資源
亞美尼亞語
波羅的─斯拉夫語族
- 斯拉夫語的同音異義詞彙
- Glossika 白俄羅斯語
- Glossika 捷克語
- Glossika 拉脫維亞語
- Glossika 立陶宛語
- Glossika 波蘭文
- Glossika 塞爾維亞語
- Glossika 斯洛伐克語
- Glossika 烏克蘭語
- 免費立陶宛語簡介電子書
- 波蘭語常用字資料庫 (約一億個從電視與電影字幕蒐集而來的單字)
- 波蘭語免費線上有聲書 (蒐集超過四千本書;部分為立陶宛語有聲書,搜尋 lietuvių 就能找到)
- 斯洛伐克語平行語料(含捷克語)
- 教會禮儀俄語生難字辭典
- 俄羅斯語辭典
日耳曼語族
- 荷蘭語常用字 (約四千四百萬個從電視與電影字幕蒐集而來的單字)
- Glossika 德文
- Glossika 冰島語
- 英語語彙網(普林斯頓大學建立)
希臘語
- Glossika 希臘文
- 現代希臘語常用字資料庫 (來自六千部電影字幕)
印度─伊朗語族
羅曼語族
- 日常法語(含35小時的高品質音檔,內容為46位法語人士與朋友的對話)
- Glossika 西班牙文
- Glossika 加泰隆尼亞語
- Glossika 法文
- Glossika 義大利文
- 拉丁語圖書館
語言描述
- 關於世界語言 (喜歡它的排板與資料。內容主要是對個別語言與語族的介紹)
- Ethnologue(收錄現存七千多種語言的資訊,包括異稱、人口、使用地區、語言地圖、語言現狀、語言分類、方言名稱、語言使用與發展及採用的書寫系統。它也有相關研究連結。每個語言頁面都能通往OLAC公開語言檔案庫 的資源與研究報告。)
- Glottolog(世界語系、語言與方言的詳盡目錄)
- Language Gulper(關於語系的部落格)
- Linguasphere 目錄(包含地理語言分類,以及經編碼與按字母排列的世界語言索引)
- Multitree(關於語言關係假說的檢索資料庫)
機器翻譯
- Apertium 包含阿斯圖里亞斯語(Asturian)、阿拉貢語(Aragonese)、布列塔尼語(Breton)、北薩米語(Northern Sami)、奧克語(Occitan)、韃靼語(Tatar)
- Bing 包含白苗語(Hmong Daw)、克林貢語(Klingon)、歐托米語(Otomi)、猶加敦馬雅語(Yucatec Maya)
- Google 近期加入新語言:阿姆哈拉語(Amharic)、科西嘉語(Corsican)、弗里西語(Frisian)、吉爾吉斯語(Kyrgyz)、夏威夷語(Hawai`ian)、北庫德語(Kurmanji)、盧森堡語(Luxembourgish)、薩摩亞語(Samoan)、蘇格蘭蓋爾語(Scots Gaelic)、修納語(Shona)、信德語(Sindhi)、普什圖語(Pashto)、科薩語(Xhosa)
- PROMPT(俄羅斯語)
地圖與媒體的樂趣
- 延伸與加強語言學習的書與小說
- Langscape (語言多樣性入門。透過互動工具與既有研究,提供從學術到娛樂等具不同興趣使用者認識世界語言的管道。含超過三千種語言的試聽音檔。)
- 聲音比較 (同一語族內語言的關鍵詞彙比較,構成一互動地圖。)
- 語言地景(以互動式地圖呈現出世界各地語言的樣本與音檔。這個網站目的在喚起對少數甚至瀕危語言的認識。)
- OPEN 電影字幕語言
- YIFY 電影字幕語言
- 用任何語言看電視
- 用任何語言取名字
南亞語系
- 漢越辭典
- 孟語(Mon)辭典資源
- 南亞語系計畫(參考Huffman Papers,內有該學者整裡的柬埔寨語大綱)
- 越南語辭典資源.
- Glossika 越南語(北部音)
- Glossika 越南語(南部音)
音位學相關
- 碩士論文:衍生音位學(Derivational phonology)
- Glossika 發音影片 (每一個音標都有一個影片)
- Lyon-Albuquerque 音位學資料庫.
- PHOIBLE(跨語言音位學清單。2014 年版本收入了 2155 個清單,包含 1672 種語言中的 2160 種音段。)
- 重音與口音模式 (語言種類學資料庫,收入 750 個語言)
- 音調資料庫
- 音位學音段清單資料 (UPSID;加州大學洛杉磯分校建立,收入 451 個語言)
- UD 音位學重音資料庫(世界語言的主要重音模式)
- 世界語言語音組合(phonotactics)資料庫 (澳洲國立大學建立;解釋語言中語音組合限制的檢索資料庫。你可以在其中比較不同語言的語音組合模式與語音特徵(features)、了解不同語音特徵在各種語言環境下的發生頻率,並觀察各種模式在互動地圖上的地域分布。)
閱讀工具
皮欽與克里奧爾語等語言
- 皮欽與克里奧爾語的線上語言架構地圖
- 瀕危語言檔案庫
- 少教授語言的教學素材(Less commonly taught languages, LCTLs)
語意學、語料庫與語源學
- 借用詞綴(affix)資料庫 (101 個語言中被借用的詞綴)
- 自動化相似度判斷程式系統 (ASJP;收入世界所有語言的詞彙表。透過比較這些詞彙表,可以找到詞彙距離。這對於分類語言群,推斷語言從原有語支分岔出去的時間非常有幫助。)
- Concepticon (從 51 個概念清單連結到 2206 個概念集合,以及 9611 個子概念。其中的 243 個概念間的關係有清楚定義。)
- 跨語言一字多義資料庫 (包含 64 個語系的 221 個語言,收入超過 30 萬個字與一萬個概念。)
- DFG 以演算法與語料庫方法為基礎的語言類型比較計畫(大量的語言比較,聖經語料庫含 1169 種語言翻譯,這些語言則被分配到 906 種不同的 ISO-639-3 代碼。)
- 國際字彙統計資料庫創辦人George Starostin 繼承了父親 Sergey Starostin 在總語系(macrofamilies)與深度語源學(etymology)的研究工作。內收入許多南撒哈拉語言,包含班圖語(Bantu)與科伊桑語(Khoisan)、尼羅─撒哈拉語言、高加索語言與美洲大陸原住民語言。然而,其中有許多深度語源學研究資料並未被廣泛接受。
- Google 書籍詞頻統計(N-Gram Viewer).
- 韓語語料庫
- 線上字典清單(包含 6300 個字典資源)
- NLTK Corpora(自然語言工具箱)
- 4 千個語言的數字系統
- 公開平行語料庫
- 人稱代名詞系統資料庫
- 疊字(reduplication)資料庫
- 語意轉換(semantic shifts)資料庫(世界語言中的語意連結,例如一字多義與語意轉換)
- 各個語言的世界人權宣言
- Wordbank(兒童字彙學習歷程)
- WOLD(借用字資料庫)
- 萊比錫大學詞彙庫(可以用 222 種語言在 246 種以語料為基礎的字典查詢)
漢藏語系
- 緬甸語辭典資源
- 中文詞彙頻率 (來自電影字幕。詞彙表可供下載)
- Glossika 中文
- Glossika 廣東話
- Glossika 台語
- Glossika 溫州話
- Phonemica(鄉音苑;由母語人士錄製數百個中文方言的音檔。部分附音標與註解。)
- 斯高克倫(Sgaw Karen)辭典資源
- 中央研究院:中文句結構樹資料庫
- 台語與客家語辭典
- 漢學文典(中文語言概念架構的歷史與比較百科)
- 阿薩姆語(Assam,屬於藏緬語族)
句法學
- 語言類型學資料庫(由烏特勒支語言學院建立)
- Irvine 語音組合法線上辭典(IPhOD)
- 世界語言的句法架構.
- ValPal(Leipzig 線上資料庫;以 80 個最具代表性,且在文獻上顯示特殊句法模式的動詞建立問卷,並以調查結果搭配語言學配價(Valency)模式,做為資料庫基礎。)
壯侗語系
逐字稿工具
- 如何在德語中加上重音符號
- 如何在俄羅斯語中加上重音符號
- Ishida 萬國碼轉換器(轉譯至 HTML, Javascript, CSS, URI, Hex 等輸出格式)
- 萬國碼字母表
跨新幾內亞語系
- 新幾內亞語言資料庫(跨新幾內亞語系現在幾乎涵蓋整個新幾內亞內陸。這個語系大概是世界第三大語系,包含四百種語言。它也不時會被認為是源於一萬多年前,種植塊根植物的農業型態。)
語言類型學
- 全球語言檔案庫(德國康斯坦茨大學建立)
- Pangloss(世界語言的語音資料庫)
- 語言文法珍稀資料庫(德國康斯坦茨大學建立)
- 交互標記(reciprocal markers)資料庫
- 語言類型學資料庫
- 副詞加強語與反射代名詞資料庫
- 語言架構地圖 (WALS)
- WALS 瀏覽器 (展示所有 WALS 資料庫的功能、語言的地理位置與譜系,幫助使用者分辨語言接觸(language contact)與譜系繼承。)
烏拉爾語系
讓 Glossika 協助你學習外語!我們利用間隔重複和演算法,依據您的程度提供最適合的訓練內容,每天都能練習新的句子和複習舊的句子。我們提供 1000 次的免費練習,立即開始吧!
原文:List of Language Resources
中文實習編譯:Bryan Chou