语言记录学里原文本的样式

语言记录学一般只针对比较小的语言,所以不可能有单独某个语言的数据库可以直接引用。但是有些时候我也会得到其他研究者的资料。和别的研究者对于数据保持相同的记录样式是非常重要的。

虽然田野实战中经常用到的软件是 Toolbox,但是实际上交换数据的时候很少能把 Toolbox 的数据文件毫不费力地转给别人,因为可能大家记录的进度,使用的语法标签不一样,生硬地导入导出可能最后又要花更多的时间来修正。

所以大部分资料会是 TXT,WORD, PDF 等格式。打开一个资料包,发现只有一个 WORD 文件(!)加上一个 PDF 文件(加上 PDF 可能是怕别人没有相关字体),换行乱七八糟,不能用。

其实吧,每一个整理得乱七八糟的文件都有清晰的目的性。揣摩记录人员的想法很重要,我觉得理解了文件的构成也就理解了这些文字记录工作者都是怎么工作的。

仔细看一下,这个文档的所有段落都有三行主干,第一行是“外语原文本”,第二行是“英语意译”,第三行是“注释”。

唯一有点特别的可能是第二行和第三行的设置,大部分学术文献中会出现的 interlinear gloss(我一般中文翻译成 “行间逐字预翻译”)都是这个样子的:

第一行:外语原文本
第二行:每一个语素的释义
第三行:英语释义(有些时候这行也会省去)

我先从维基百科弄个普通一点例子来(例子中第一行出现的语言是阿兹台克语):

不会有这种语法标注的原因很简单:我们(还)不知道,我们的线人也不知道。在实际记录语言的过程中,线人有最基本语言学知识的可能性几乎为零。

我们都遵循比较“自然”的记录方式,当线人给出一个表达之后,会将这个表达作为一个整体翻译成我们可以听得懂得语言,然后再对于这个表达内的各个细微的部分进行阐述。

所以原文本的样式是这样的

第一行:外语原文本
第二行:英语意译
第三行:注释

有时候,注释的部分可能非常非常得长……


缘起篇一般都不需要题目的

最近两年,或者说三年内,好像都没有什么写过什么关于我自己的事情。倒不是因为没什么事情发生,而是我觉得,当一个人沉浸在只做一件事情的时候,就会慢慢地觉得其他的事情都变得没那么多意义了。对于人生的观念也时起时落,今天开心一些,出去河边散步,明天又低落一些,窝在家里睡觉。时不时地写写东西,接着总又擦掉,总觉着,既然写的字连自己也感动不了,那就干脆不要给别人看好了。


“乞力马扎罗”的意思

乞力马扎罗山的英语写法是 Mount Kilimanjaro。在很多中文媒体中,Kilimanjaro 被认为是一个斯瓦希里语词,意思是“光明之山”。

实际上“乞力马扎罗”这个词的词源非常不清晰。首先Kilimanjaro是一个复合词Kilima-Njaro,Kilima是一个斯瓦希里语词,意思是“小山丘,山峦”,而Njaro在现代斯瓦希里语中没有对应。有一些人认为Njaro是斯瓦希里语古语中“闪闪发光”的意思,另一些人认为Njaro其实指的是“伟大”。在中文媒体中出现的“光明之山”可能是对两种说法的一种综合。


下一次去肯尼亚要拜访的人列表

Dr. Helga Schröder
位置:
听说在内罗毕大学
原因:

Word Order in Toposa: An Aspect of Multiple Feature-Checking. SIL: SIL International Publications in Linguistics
Schröder H, Schröder M. “The Toposa Verb.” OPSL (Occasional Papers in Sudanese Languages.. 1986;5::1-47.
“Relevance Theory: recent developments, current challenges and future directions” 5th International Symposium on Intercultural, Cognitive and Social Pragmatics, Seville, Spain, 14-16 March 2012 -