
唐能翻譯牛:
術(shù)語提取和管理是翻譯工作中非常重要的一個(gè)環(huán)節(jié), 如何正確地提取術(shù)語, 我們看看Tmxmall的一者君是如何說的。
一者君在前幾期教程中介紹了如何利用MultiTerm新建術(shù)語庫,添加、批量導(dǎo)入與導(dǎo)出術(shù)語,那么如何在現(xiàn)有文檔中如何提取出術(shù)語呢?這就需要用到MultiTerm中的一款配套工具——SDL MultiTerm Extract。利用該款軟件,我們可以從翻譯文檔或翻譯記憶庫中根據(jù)自身的需要提取出術(shù)語,構(gòu)建自己的術(shù)語表。下面我們以國務(wù)院2017年政府工作報(bào)告雙語翻譯記憶庫為例,為大家展示雙語的術(shù)語提取。
step
1
打開SDL Multiterm Extract后,點(diǎn)擊File→New Project來新建項(xiàng)目,并選擇所要?jiǎng)?chuàng)建的項(xiàng)目類型,為項(xiàng)目命名并選擇存放路徑,項(xiàng)目默認(rèn)存儲(chǔ)在SDL Multiterm Extract文件夾里的Extract Projects中。
單語術(shù)語提取項(xiàng)目:提取一個(gè)或多個(gè)單語文檔中的術(shù)語
雙語術(shù)語提取項(xiàng)目:從雙語文檔中提取出雙語對(duì)照的術(shù)語
翻譯項(xiàng)目:用來翻譯現(xiàn)有術(shù)語庫中的術(shù)語,所以創(chuàng)建這個(gè)項(xiàng)目時(shí)本身要有術(shù)語庫
QA項(xiàng)目:這個(gè)項(xiàng)目可以幫助你檢測(cè)文檔或術(shù)語庫中術(shù)語的使用情況,評(píng)估和改進(jìn)這些術(shù)語翻譯的質(zhì)量。
詞典編譯項(xiàng)目:從雙語平行文本中提取出詞典。
我們?nèi)粘3J褂玫膭t是前兩種項(xiàng)目類型;
step
2
點(diǎn)擊下一步,可以選擇術(shù)語庫。創(chuàng)建翻譯項(xiàng)目和QA項(xiàng)目時(shí)必須有術(shù)語庫,而提取單語術(shù)語和雙語術(shù)語則無需選擇術(shù)語庫,只需選擇源語言和目標(biāo)語言即可;
step
3
點(diǎn)擊下一步,點(diǎn)擊Browse添加待提取術(shù)語的文件;
step
4
點(diǎn)擊下一步,進(jìn)入排除術(shù)語的向?qū)Ы缑?。我們可以選擇“Exclude termbase”,排除某個(gè)已有術(shù)語庫中的術(shù)語,也可以選擇“Exclude file”排除自己動(dòng)手創(chuàng)建的排除詞匯或術(shù)語的文件。如果不希望排除,也可以直接略過此步驟。我們選擇排除MlutiTerm自帶的樣本術(shù)語庫基本詞匯;
step
5
點(diǎn)擊下一步,彈出“Term extraction settings”界面。這里可以根據(jù)自己的需要設(shè)置術(shù)語短、長有幾個(gè)單詞,提取術(shù)語的很大數(shù)量,以及噪音值調(diào)整。Silence值越高,提取的術(shù)語數(shù)量相對(duì)較少,質(zhì)量越高;Noise值越高,則提取出的術(shù)語數(shù)量較多,質(zhì)量相對(duì)較低。我們這里舉例來將2個(gè)單詞以上5個(gè)單詞以下(包含兩個(gè)單詞和五個(gè)單詞的詞語)的詞語提取出來作為術(shù)語;并把噪音值調(diào)高,以便擴(kuò)大提取術(shù)語的范圍。
設(shè)置完成后,點(diǎn)擊“Stopword Lists”,加載原文和譯文的停用詞表;
停用詞指的是計(jì)算機(jī)進(jìn)行檢索時(shí)自動(dòng)過濾到的一些虛詞和非檢索詞,這些詞大多沒有實(shí)際語意。MultiTerm里為我們提供部分語種的停用詞表,而中文的停用詞表則需要我們根據(jù)需要自行去網(wǎng)上搜索。
step
6
點(diǎn)擊下一步,設(shè)置詞頻,然后點(diǎn)擊下一步至完成,完成項(xiàng)目創(chuàng)建。
step
7
確認(rèn)提取后,彈出確認(rèn)提取術(shù)語界面;系統(tǒng)過自動(dòng)基于上述制定的規(guī)則進(jìn)行初步術(shù)語提取。
step
8
初步提取完成之后,右擊鼠標(biāo),可對(duì)提取的候選術(shù)語進(jìn)行編輯并刪除無用、提取錯(cuò)誤的詞組;點(diǎn)擊“Concordance”還可以查看術(shù)語在翻譯記憶庫中的句對(duì)語境。可在上方“Filter”對(duì)術(shù)語進(jìn)行過濾顯示。
step
9
完成步驟之后,即可對(duì)術(shù)語進(jìn)行導(dǎo)出。點(diǎn)擊file→Export,選擇需要導(dǎo)出的格式??蛇x擇導(dǎo)出到現(xiàn)有術(shù)語庫中、xml術(shù)語庫文件及左右兩列(Tab delimited)的txt文本文檔,點(diǎn)擊下一步,選擇導(dǎo)出存放路徑。之后一路下一步直至完成即可。這樣,術(shù)語提取就全部完成了,可以將制作完成的術(shù)語導(dǎo)入術(shù)語庫或Trados中進(jìn)行使用了。
單語術(shù)語的操作流程與提取雙語的操作流程相同,只需在新建項(xiàng)目時(shí)選擇單語術(shù)語提取項(xiàng)目即可。
在翻譯記憶庫中提取雙語術(shù)語時(shí),還有更簡單的方式哦。Tmxmall與語智云帆術(shù)語寶強(qiáng)強(qiáng)聯(lián)合,您只需訪問Tmxmall在線對(duì)齊(http://www.tmxmall.com/aligner),選擇單文檔對(duì)齊將tmx文件導(dǎo)入,然后點(diǎn)擊“提取術(shù)語”,設(shè)置詞頻、源語言和目標(biāo)語言。系統(tǒng)會(huì)自動(dòng)根據(jù)智能算法為您提取術(shù)語哦??芍苯釉诰W(wǎng)頁上對(duì)術(shù)語進(jìn)行編輯與刪除。提取后的術(shù)語可選擇導(dǎo)出下載Excel表格、同步到Tmxmall私有云術(shù)語庫或術(shù)語寶中哦。
溫馨提示:術(shù)語提取頁面有可能被瀏覽器攔截,請(qǐng)?jiān)谔崛∏皩g覽器設(shè)置中“廣告過濾”關(guān)閉,谷歌Chrome瀏覽器在“設(shè)置-隱私設(shè)置-內(nèi)容設(shè)置”中選擇“允許彈出新彈窗”即可。
本文轉(zhuǎn)自:tmxmall(微信公眾號(hào)ID: tmxmall),歡迎前往訂閱!