為什麼這篇德文名詞性別查詢鄉民發文收入到精華區:因為在德文名詞性別查詢這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者StorageandDi (close lid between uses)看板Deutsch標題...
附文內完整超連結的網頁版:
https://storageanddisposal.blogspot.com/2017/07/dwds.html
在寫論文的最後階段我發現了一個非常好用的免費線上德德字典「DWDS」。出乎我意料,
可能因為在德國說到字典大家立刻就會想到Duden,好像並沒有太多人知道這個線上字典的
存在。德國朋友就不用說了(多少台灣人一年會需要用到一次中文字典?),我的台灣朋
友也大都使用Duden或其他比較有名的出版社的字典。
Duden會成為德德字典的代名詞不是偶然。如果仔細比較就看得出來,Duden提供的字義解
釋的確相當精準而且簡鍊。但對於像我這樣因為寫論文而幾乎必須天天查德文字典的外國
人來說,Duden免費線上德德字典有兩個很大的缺點:
第一是Duden網站的網頁載入速度實在有夠慢。廣告超多,而且網站設計上,輸入想查詢的
字以後,Duden第一步會先帶你到搜尋結果頁(順便給你看很多廣告),點擊想查詢的字以
後(通常就是搜尋結果的第一筆,讓搜尋結果頁顯得很沒意義,何不像牛津線上字典一樣
直接引導查詢者到辭條本身?),才會真正進入該辭條的頁面。而且這時候當然會再次載
入新廣告,必須再等十秒鐘讓網頁跑完,要等到它一切就緒人都枯槁了。對於有很多德文
字必須查詢的人來說,Duden網站的龜速讓我非常沮喪。
第二個更大的缺點是Duden網站提供的例句很少。對於像我這樣德文語感還不夠精準,但是
又不想整篇論文一直重複使用同樣幾個簡單德文單字的人來說,使用進階字有個很大的風
險,就是常常會被我的語言交換伙伴糾正:「其實這個字德國人不會使用在這個文句脈絡
裡頭」。
如果字典能提供大量來自真實世界的、德文母語者所書寫的例句,對於理解特定字詞的正
確使用方法其實會有很大的幫助,而這就是我覺得DWDS最好用的地方:它的語料庫提供了
上百萬個來自真實世界的德文例句,而且查詢非常方便。(雖然提供例句的網路德文字典
很多,例如Linguee,但是我真的認為DWDS更好用。)
在被Duden折騰了好久以後,我從去年的夏末開始使用DWDS。由於我自己從DWDS得到許多幫
助,論文寫作的最後期間常常會被新發現的DWDS強大功能驚嚇到,所以一直有個念頭,希
望論文終於告一個段落之後可以好好認真來寫一個給中文母語者參考用的DWDS使用說明,
讓身邊更多需要用德文作專業書寫的朋友能夠充分利用這個非常厲害的免費線上資源。以
下是我的DWDS簡介:
一、基本架構與網頁呈現
Das Wortauskunftssystem zur deutschen Sprache in Geschichte und Gegenwart(當代
與古代德文字詞檢索系統)的舊名是Digitales Worterbuch der deutschen Sprache
(德文電子字典),新舊名稱的縮寫都是「DWDS」。
嚴格說來DWDS並不是一部單一辭典,而是一個以四本大字典,亦即東德科學院的當代德語
字典(Worterbuch der deutschen Gegenwartssprache)、Duden德語大字典(Grosses
Worterbuch der deutschen Sprache)、格林兄弟德文字典(Das Deutsche
Worterbuch)以及德文字源字典(Etymologisches Worterbuch des Deutschen
)為最主要辭條來源的龐大資料庫。
不過使用者不知道這些背景資訊也完全沒差,因為搜尋介面就跟一般網路字典一樣簡單。
使用上唯一必須注意的一點是,搜尋功能對大小寫敏感。例如輸入「gleichwohl」跟「
Gleichwohl」會得出不同搜尋結果。搜尋「Gleichwohl」,DWDS會很誠實地告訴你這個字
的確存在,但本資料庫未收錄。
又,如果不是衍生字義的情形,而是「同形異義」的字,DWDS會區分成不同辭條(參見例
如「Bund」,不過這一點其實Duden也有做到)。
網頁佈局上,每一個辭條旁邊都會標示該辭條是來自哪一本字典,來自格林兄弟字典的古
老字義的超連結則顯示於右側邊欄。DWDS自己的辭條編寫得非常用心(截至2017年7月4日
為止,已經有1498個重新編寫或新增的辭條,持續更新的新辭條清單在此)。
完全由DWDS團隊獨立全新編寫的辭條內容尤其華麗,參見例如「Volk」。DWDS團隊翻新
Duden大字典的辭條也都能達到錦上添花的效果,例如「verdeutschen」一字的字義解說還
有貼心附上區分文法結構的詳細「慣用字詞組合」(Kollokation)。
二、豐富的例句
DWDS的例句都是來自真實文獻,包括報紙、雜誌(我之前因為查詢「mittragen」這個字而
得知了知名左派雜誌konkret的存在)、甚至二戰前線郵件資料庫(Das Feldpost-Archiv
)。唯一可惜的是欠缺像免費線上字典Linguee那樣的貼心設計,允許使用者直接點網路連
結連回原始文件。
DWDS團隊自己編寫的辭條,底下所附例句是由編輯精挑細選。至於來自東德科學院當代德
語字典的辭條如果有自己的例句,則常常是來自代表性的德文文學作品,同時底下的例句
欄還附帶呈現電腦程式自動挑選的例句。
但即使是電腦選的例句,品質依然非常好。例如,我有一次想要知道德國人會不會用「
Paradebeispiel(經典案例)」來形容負面的例子,就在底下的例句欄看到德國財政部長
Schauble的一句話:「Fur mich ist das ubrigens ein Paradebeispiel
, warum ich gegen plebiszitare Elemente in der Politik bin.(這對我來說也
同時是個代表性案例,為什麼我反對公民投票。)」)。
如果覺得這些例句還不夠,頁面右側邊欄還有提供例句庫(Korpustreffer)的超連結,點
擊就會列出DWDS例句庫中所有包含這個字的例句。每個辭條的最後面會提供一個類似標籤
雲形式的「經常同時出現或合併使用的字(Typische Verbindungen)」概覽圖(Duden也
提供類似的圖),對於理解該字的用法也有一些幫助。
如果只需要查例句而不需要查詢字義,也可以直接從首頁點選「語料庫(Textkorpora)」
,搜尋方式一樣簡單,甚至還可以方便地挑選自己偏好的語料庫,我自己最常用的是收錄
《時代週報》1945年至2016年大部分報導的「Die Zeit 1945-2016」語料庫。《時代週報
》的記者大都文筆很好,例句頗具參考價值。
三、超強大的語料庫分析功能
從DWDS的標籤雲還可以進一步連結到該字使用方式的詳細語料庫分析表(DWDS-Wortprofil
),當中分門別類地羅列了經常與該字合併使用的動詞、形容詞、名詞、介系詞以及其合
併使用的頻率。
表中與頻率相關的數值有兩個,「Frequenz」直接指合併使用的情形在語料庫中出現的次
數,「logDice」則是排除文本資料庫大小的影響後的數值。例如若查詢Unterschied(差
異)這個字的語料庫分析表,可知最常搭配使用的形容詞是wesentlich(本質上的),出
現次數高達2054次。但是logDice指數最高的卻是fein(微妙的),雖然其出現次數只有
1865次。就我不專業的使用感覺,logDice值在5以上的相關詞,都算是常見的合併使用狀
況。
慣用字詞組合是個非常實用的參考資訊,就例如中文裡頭我們會說「濃茶」、「烈酒」,
但是不會說「烈茶」、「濃酒」。知道慣用字詞組合的頻率可以幫助我們避免寫出奇怪的
德文。
由於不同類型的字,與其他動詞、形容詞、名詞、介系詞會有不同強度的相關性,這一點
在語料庫分析表中也有簡單明瞭的視覺化呈現。
相關性越強的類別,會有越深的藍色邊條。例如看「Genugtuung」這個字的語料庫分析表
可以知道,雖然文法上絕對ok,但實際上只有很少數現代德文書寫者會為這個字加上所有
格定語(Genitivattribut),罕例就例如Genugtuung der Opfer(「受害人的」補償),
但這個字常常會在句子中與其他名詞連用(見「in Koordination mit」欄)。而這個相關
性強度差異從「in Koordination mit」與「hat Genitivattribut」兩個欄位左側一深一
淺的藍色邊條可以很容易看出來。
語料庫分析表中,「屬於介系詞組(ist in Prapositionalgruppe)」以及「擁有介
系詞組(hat Prapositionalgruppe)」兩個欄位對於確認介系詞也有很大的幫助。
四、超乎想像強大的語料庫分析表結合例句搜尋功能
語料庫分析表還有一個很驚人的功能是直接連接例句,點擊語料庫分析表當中的任何單字
,底下都會跳出同時包含原始查詢單字以及所點擊單字的例句。
舉例而言,從Konflikt(衝突)這個字的語料庫分析表可知,它經常與entscharfen
(化解)這個動詞連用,點擊entscharfen,底下就會跳出許多包含「化解衝突」這
個說法的例句。
又例如Koexistenz(共存、共處)的語料庫分析表顯示這個字經常成為gewa
hrleisten(確保)這個動詞的受詞,點擊gewahrleisten,底下就會跳出許多包含「
確保和平共存」這個說法的例句,實在非常方便。
我自己的使用經驗是,標籤雲和語料庫分析表在想要使用進階字的時候能夠提供非常有用
的幫助。例如「Drohgebarde」的標籤雲跟語料庫分析表就很清楚指出,這個字最常
使用在軍事的脈絡中。
五、語義相似字的使用脈絡比較功能
這個語料庫分析表非常強大,甚至還提供比較分析的功能,使用者可以比較兩個意思差不
多的字的使用脈絡。
例如輸入「vermutlich」與「wahrscheinlich」這兩個同樣都有「可能」的意思的字,選
擇搜尋「共同點」,可以發現這兩個字用來形容意外事故的頻率很相近(「可能的事故發
生原因」既可以說「vermutliche Unglucksursache」,也可以說「wahrscheinliche
Unglucksursache」)。
而如果選擇搜尋「相異點」,則可以發現在表示「涉嫌」的時候通常會使用「vermutlich
」(例如der vermutliche Morder,殺人嫌疑犯),在表示預測可能性的時候通常會
用「wahrscheinlich」(例如der wahrscheinliche Kandidat,可能的候選人)。
重點是這麼方便的工具居然完全免費,對英文字進行相同分析的網站「Sketch Engine」一
個月要收使用者將近五歐元。不過這個語料庫分析功能的一個缺點是收錄的字較少,只有
十萬五千個字,例如「einschlieslich」就查不到相關資訊。再者,有些常見的字不
知為何也沒有完整的資訊。
六、語料庫搜尋技巧
這邊再詳細說明一下前面已經提到過的DWDS語料庫的搜尋技巧。語料庫網頁提供來自報紙
、學術文獻、電影字幕、部落格等的例句,而且就像前面提到過的,查詢時可以指定單一
來源(單一語料庫),例如指定搜尋電影字幕。電影字幕對於理解特定字詞在德文口語中
的使用方式非常有幫助。
另一個亮點是可以直接輸入片語來搜尋相關例句,而且有強大的模糊搜尋功能,如果不是
做精確搜尋的話,搜尋結果不但包括動詞的各種時態與冠詞、形容詞的所有性別變化,也
不受字詞順序影響。
如果想要做更精確的搜尋,例句庫提供的搜尋指令也很強大,就像如果想搜尋在一個句子
裡頭連用卻沒有鄰接彼此的兩個字的用法,例如「wenn ... erst」,就可以輸入「"wenn
#3 erst"」(指定搜尋wenn先於erst出現,中間最多間隔三個其他字的所有例句),又例
如「im Dienste stehen」這個片語常以「im Dienste 某物(屬格) stehen」的型態出現
,搜尋「"im Dienste #3 stehen"」就可以找到許多包含這個型態用法的例句。
DWDS自己提供的強大搜尋指令範例是,如果輸入搜尋指令「"{von,der,im,am} WITH $.=0
@Anfang ist #2 $p=NN" && !Wort"」,就可以找到所有以「最初是+名詞」開頭的例句,
但是排除聖經的「太初有道」出現在搜尋結果。
又例如,有一次我想要知道「我認為(Meiner Meinung nach)」到底有多少可能的其他說
法,就分別搜尋了「"$p=PPOSAT WITH $.=0 #=1 nach $p=VAFIN"」(翻譯年糕:「開頭第
一個字是所有格代名詞 + 間隔一個字 + nach + be動詞」)以及「"$p=PPOSAT WITH $.=0
#=1 nach $p=VVFIN"」(翻譯年糕:「開頭第一個字是所有格代名詞 + 間隔一個字 +
nach + 普通動詞」),果然得出了一些有趣的結論。
有興趣瞭解進階搜尋指令的朋友可以參考這裡的搜尋指令教學。如果想知道更多,這裡還
有更詳細的指令結構說明。
和DWDS的字典例句一樣,例句庫提供的例句無法像Linguee那樣直接點連結連回原始文件,
但如果點擊每條例句右側的下拉式漢堡選單,就會出現例句的詳細來源資訊紀錄,包括作
者、文章名或書名、出版年份等,有些來自公開網路資源例如Die Zeit Achiv的文章,也
會在來源說明中附上網路連結。
另外還有一個語料庫專門收錄訪談逐字稿(在下拉式語料庫清單中的名稱是「Gesprochene
Sprache」),不過只收錄六百份文件,樣本數極少。
關於DWDS所有功能的詳細說明可見此一頁面。
七、字源說明
DWDS的字源說明是來自Wolfgang Pfeifer 編纂的「字源字典(Etymologisches Wo
rterbuch)」,考據非常細,對於字義演變的呈現在大多數情況比Duden網路字典清楚多了
。
我自己的德文學習經驗是,「理解字根的意思」作為一種背單字的技巧,在背德文單字的
情形比用字根背英文單字效果更顯著,原因可能是因為英文單字的字源太雜了,德文字根
的意義一般來說似乎比較固定。
少數Duden網站上的字源說明比Pfeifer清楚的例外可參見「vergriffen」。vergriffen為
什麼會有「售完」的意思一度讓我非常困惑(直覺上不是應該更像「拿錯」嗎?)。看了
Duden的說明才知道「售完」的字義是衍生自vergreifen的古代字義「拿走」。Pfeifer則
只有說明「售完」的意思出現於十八世紀。
Pfeifer在結構上是以基本字出發,然後把同一家族的字集合在一起做說明,例如查詢「
vergreifen」的字源,就會先回到greifen這個字、查詢「Entrustung」的字源,就
會先回到Rustung這個字,然後就可以知道相同字源的Entrustung與Abru
stung為什麼現代字義差蠻多的。
又例如查詢「Genugtuung」的字源,就會先回到genug這個字,然後展示包括「Genu
ge」、「genugsam」、「genugtun」的整個家族。又例如想知道動詞「tagen」的字根明明
是「日子(Tag)」,為什麼會有「開會」的意思,查詢會知道原來「tagen」作為動詞有
「擇日」的意思,是從那裡衍生出「擇日開會」的意思。
Pfeifer本身的缺點是有些字沒有拆解字根,例如「Ursprung」,然後還是有些字欠缺字源
說明,例如「ausgaren(unausgegoren)」。
八、真人發音
大部分字都有真人發音,同一個字有多種發音時,每一種都唸給你聽(如「ungefahr
」)。
九、DWDS的缺點:
DWDS並不完美,我目前覺得比較明顯的缺點如下:
首先,有些辭條沒有同時顯示相關片語,這方面反而是Duden做得比較好。
其次,DWDS還是有極少部分單字完全欠缺字義說明,例如「Pressespiegel」。不過
Pressespiegel這個字在Duden上的解釋也非常簡略,反而是德文維基辭條對Pressespiegel
的字義有較清楚的解釋。
另外,DWDS也沒有收錄人名,例如「Goethe」只在Duden上查得到。不過嚴格說來這應該不
算大缺點,反正有維基百科。
最後,同義字查詢功能似乎還是Duden網路字典比較優秀。DWDS的同義字是來自
openthesaurus.de,但是我對openthesaurus.de的同義字品質仍有疑慮。
十、附論:東德字典的轉型正義(咦)
DWDS的原型是柏林–布蘭登堡邦科學院一個野心龐大的計畫:他們想打造一個人人可以免
費查詢的完整德文單字資料庫。由於柏林–布蘭登堡邦科學院的前身是東德國家科學院,
他們正好有完成這個計畫所需的原始資料,也就是當年東德科學院辭書學者編纂的六冊「
當代德語字典」(約九萬個辭條)以及他們校對完成的格林兄弟德文字典。另外他們也跟
Duden的母公司Bibliographisches Institut簽約,從十冊的Duden德語大字典中匯入了約
七萬個辭條。(比較:名聲響亮的Duden「Die deutsche Rechtschreibung」字典2013年第
26版有十四萬個辭條)
可想而知,以東德字典為基礎的麻煩是,「當代德語字典」的品質雖然不錯,但是當中大
概有兩千六百個與共產主義、馬列思想相關的單字解釋基於東德(德文簡稱DDR)的言論管
制而有非常濃厚的共黨官方色彩,所以DWDS團隊當年開始數位化「當代德語字典」與建置
資料庫的同時也必須改寫這些辭條,或者為辭條說明增加「DDR特殊用法」、「馬克思主義
」等標記,最後一共有五千一百個辭條被全部或部分改寫。
DWDS在自家網站上引述「當代德語字典」第四冊的編者前言,指出當代德語字典從第四冊
(1974年出版)開始力求反映「馬列主義世界觀」,並全面依照這個原則改寫已出版的前
三冊。
後來DWDS降低傷害的方式,是決定採用沒有受到這個編輯原則影響的舊版前三冊(初版分
別出現於1964、1967、1969年),並同時全面改寫共黨官方色彩濃厚的辭條。
十一、結論
雖然先天有點不良,但是在DWDS團隊的努力之下,目前的DWDS非常好用。
十二、同場加映:其他好用的免費線上德文字典
邁迪字典:提供很多例句非常實用(要按「Beispielsatze」那個按鈕),所以雖然
介面奇醜無比,但仍是堪用的例句資料庫。它相較於Linguee的優點是,因為例句取自於德
國報紙文章,所以例句很精鍊,有時候甚至很有趣。缺點是只能用單一字詞做搜尋,不能
輸入片語。更大的缺陷是完全欠缺模糊搜尋功能,例如輸入動詞原型,就只會跑出包含這
個原型動詞的例句,跳不出諸如過去式、虛擬式的例句。(但如果已經熟悉德文動詞與形
容詞的各種變化型態,直接輸入不同格位的形容詞以及動詞的過去式、虛擬式…等,依然
好用。)
Linguatools:有模糊搜尋功能。例句來源包含電影字幕,有助於理解該單字在德文口語中
如何被使用。有「非常、非常」強大的過濾功能,可以單獨鎖定來自不同網域(例如德國
或瑞士)、來源(例如國會辯論、翻譯文學或電影字幕)、網站經營者(例如歌德學院或
賓士汽車)、主題領域(例如旅遊或戲劇)的例句,這真的非常方便,製作單字卡的時候
可選字幕例句,因為字幕例句通常輕薄短小又口語,寫論文的時候可以單獨搜尋文學例句
,因為通常會比較文雅。甚至可以鎖定不同字義的例句(例如besinnen同時有remember跟
consider的意思,過濾器可以設定為只顯示besinnen作為consider的意思被使用的例句)
。缺點是不能直接輸入字串。
Linguee:優點是可以輸入片語,而且系統預設的模糊搜尋功能蠻強大的。缺點是因為例句
取自於翻譯文件,所以例句往往過長(尤其來自歐盟官方文件的例句特別容易有這個問題
),但例句來自翻譯文件的優點是,行文通常較正式、優雅,適合學術書寫參考。例句也
附超連結,點擊可以連到原始文件。小提醒:Linguee提供的德文例句,有一部分是原始語
言為他國語言的德文譯文,例如以英文進行質詢的歐洲議會議員的發言逐字稿德文翻譯。
從他國語言翻譯過來的德文有時會為了遷就原文,不太像道地的德文。
Redearten-Index:似乎和etymonline一樣是由業餘愛好者架設的網站。優點:片語齊全、
除了解釋片語的意思以外,大多時候也提供例句,甚至有時候還附帶片語起源說明,對於
理解與記憶非常有用,參見例如「auf Nummer sicher gehen」、「mit List und Tu
cke」。某些辭條的起源說明還頗為詳盡,例如「jdm. in die Hande spielen」、「
jemanden im Stich lassen」、「wie aus einem Guss」。例句有時也頗豐富,例如「
jemandem eins auswischen」、「mit dem Klammerbeutel / Klammersack gepudert sein
」、「die Daumenschrauben anziehen」。釋義非常清楚的辭條,例如「auf der Kippe
stehen」。但也還是有例句與起源說明付之闕如的辭條,例如「gegen etwas Sturm
laufen」。
善用Google搜尋:以星號搭配引號進行模糊搜尋可以找到很多例句,例如「"sympathie f&
#252;r * zu gewinnen"」。
Reverso:動詞變化詳盡一覽表(提供動詞變化詳盡一覽表的網站其實超多的)。Reverso
有一個貼心設計:點擊動詞變化表當中的任一種變化,就會跳出包含該動詞型態的例句,
例句也有附上來源連結。
Dict.cc:翻譯頻率、真人發音、相對豐富的同義字、點選搜尋結果旁邊的「i」標誌會跳
出例句(例句來源是德文維基百科)。
十三、最後的小提醒
以上每一個網站的設計理念都不一樣,使用方式千差萬別(Linguatools提供的過濾器功能
尤其需要時間熟悉),所以在一次試用很多網站的情況之下,很可能會無法立即掌握各個
網站的獨特優點,如果因此而輕易將用不習慣的字典網站拋在一邊,錯失一個好用的工具
那就太可惜了,建議一開始可以把所有以上網站都加入書籤,遇到有單字需要查詢的時候
就逐一試用各網站,耐心讓這樣的過程持續幾個禮拜,再對網站是不是適合自己下最後判
斷,應該會是比較妥當的作法。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 98.216.109.126
※ 文章網址: https://www.ptt.cc/bbs/Deutsch/M.1500986000.A.FEB.html