Transcription Manual
<h3 class="heading-h6"><a name="THDLToolboxhomegtAudioVideogtLinguisticProcessingTranscriptionAnnotationAndTranslationgtTranscriptionManual" class="anchorpoint"></a><a href="/tools/wiki/home.html">THDL Toolbox</a> > <a href="/tools/wiki/Audio-Video.html">Audio-Video</a> > <a href="/tools/wiki/Linguistic%20Processing%20-%20Transcription%2C%20Annotation%20And%20Translation.html">Linguistic Processing - Transcription, Annotation And Translation</a> > Transcription Manual</h3><p class="paragraph">
</p><h3 class="heading-h1"><a name="TranscriptionGuideforSpokenTibetanTexts" class="anchorpoint"></a>Transcription Guide for Spoken Tibetan Texts</h3><ul class="star"><li>Version Control: David Germano</li>
<li>Author(s): Ed Garrett, Roger Andersen</li></ul><p class="paragraph"><span class="size5">
བོད་ཡིག་ཁ་སྐད་བསླབ་གཞི� ི་ཡིག་ཐོག་ཟིན་བྲིས་ཀྱི་ཕྱོགས་སྟོན།
</span>
</p><h3 class="heading-h2"><a name="Introduction" class="anchorpoint"></a>Introduction </h3><p class="paragraph">This article provides guidelines for transcribing spoken Tibetan texts. This task differs considerably from writing a story or letter. To faithfully represent the spoken record, it is important to write down everything everybody says, and to capture the texture of the <span style="color: blue;"> text </span> as much as possible, while still trying to preserve the principles and values of Tibetan's long-standing literary tradition.
This article starts with general principles, and then proceeds to discuss a list of crucial transcription issues in alphabetical order (not in alpha?).</p><p class="paragraph"><span class="size5">
</span></p><h3 class="heading-h2"><a name="ངསད" class="anchorpoint"></a>ངོ་སྤྲོད།</h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5"> དོན་ཚན་� དིས་བོད་ཡིག་ཁ་སྐད་བསླབ་གཞི� ི་ཡིག་ཐོག་ཟིན་བྲིས་བྱེད་ཐབས་ཀྱི་ཕྱོགས་སྟོན་མཁོ་སྤྲོད་བྱས་ཡོད།
ལས་བྱ་� དི་རྣམ་ཀུན་སྒྲུང་ངམ་� ཕྲིན་ཡིག་� བྲི་བ་དང་མི་� དྲ་བ་ཟིག་ཏུ་ངོས་� ཛིན་དགོས། དེ་ཡང་ཁ་སྐད་སྒྲ་ཕབ་ཇི་བཞིན་
མི་སུ་ཟིག་གིས་སྐད་ཅ་གང་ཞིག་བཤད་ཡོད་པ་ཚང་མ་ཡིག་ཐོག་ཟིན་བྲིས་སུ་� གོད་རྒྱུ་གལ་� གངས་ཤིན་ཏུ་ཆེ་བ་དང་སྐད་
ཆ� ི་གྲུབ་ཆ་རྣམས་ག་ཚོད་ལེན་ཐུབ་ཐུབ་བྱེད་དགོས་པ་གལ་ཆེ་ཞིང་ལས་ཀ� ི་བརྒྱུད་རིམ་ནང་མུ་མཐུད་སྲོལ་རྒྱུན་ཀྱི
གཙོ་གནད་དང་ནང་དོན་སྲུང་སྐྱོབ་རྒྱུན་� ཛིན་གང་ཐུབ་བྱེད་དགོས། །</span></p><p class="paragraph"><span class="size5"> དོན་ཚན་� དི་སྤྱི� ི་གཙོ་གནད་དང་སྦྲགས་ཏེ་� གོ་བཙུགས་རྗེས་ཐག་གཅོད་རང་བཞིན་གྱི་ཡིག་ཐོག་ཟིན་བྲིས་རེ� ུ་མིག་ཅིག་ཀ་ཁ� ི་གོ་རིམ་ལྟར་སྒྲིག་ཏེ་བཟོ་དགོས། །
</span>
</p><h3 class="heading-h2"><a name="Gettingstarted" class="anchorpoint"></a>Getting started </h3><p class="paragraph">Transcription in THDL is done in a special format that allows for transcriptions to be used in the Savant software system. Savant allows for transcriptions to be created with translations, annotations, and timecodes, so that the transcription can be played back in synchronization with the original audio or video. These transcripts must be created in QuillDriver, a sister software program that provides a user friendly way to create such transcripts. Transcripts can, however, be created in simple word processing forms, and then migrated over to QuillDriver. Please refer to the QuillDriver Transcription Manual for details on actually making transcripts before you begin doing actual transcription, whether you intend to use QuillDriver from the start or some intermediary form like pen on paper, or a word processing document. The current document focuses on the content of transcription as well as time coding transcripts. The actual creation of a QuillDriver Transcript and using QuillDriver is documented within the QuillDriver Transcription Manual.
</p><h3 class="heading-h2"><a name="GeneralPrinciples" class="anchorpoint"></a>General Principles </h3><ol><li>Do it right the first time! Don't start by doing a quick and easy transcript, thinking you'll go back later and edit and revise it. You won't. So be careful and do it right from the start.</li>
<li>Write down everything you hear, and only what you hear! In transcripts of <span style="color: yellow;"> colloquial speech lesson videos </span>, you must write down everything everybody says, including for example every <em class="italic"> 'ong, a, lags so</em> and so on. Conversely, you should not add particles to the text which do not occur in the spoken sample.</li></ol><p class="paragraph">
<span style="color: yellow;"> 3) However, for academic and other non-colloquial speech lesson videos, you should not write down every instance of habitual articles such as 'ong, a, lags so and so on. When studying these videos for their academic content, these common articles can be distracting. </span>
</p><ol><li>Try as much as possible to capture the texture and communicative impact of the speech. That means noting down pauses, interruptions, and so on.</li></ol><p class="paragraph"><span class="size5">
</span></p><h3 class="heading-h2"><a name="སརབཏངགགཙགནད" class="anchorpoint"></a>སྤྱིར་བཏང་གི་གཙོ་གནད།</h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">༡་ཐོག་མ་ཉིད་ནས་ལེགས་པར་ཕབ་རྒྱུར་� བད་དགོས། ཐོག་མར་� གོ་ཚུགས་སྐབས་མགྱོགས་སྤྱོད་དང་སླ་སྤྱོད་ཀྱིས་རྗེས་སུ་
བསྐྱར་ལོག་དང་བཟི་བཅོས་བྱ་རྒྱུ� ི་གོ་སྐབས་ཡོད་སྙམ་པ་གཏན་ནས་བྱ་མི་རུང་། དེ་ཚུལ་ཁྱེད་ཀྱིས་མི་ཆོག དེར་བརྟེན་ཐོག་
མར་� གོ་ཙུགས་ཙམ་ནས་དག་པོར་� གོད་རྒྱུ་དེ་དོན་གྱི་དམ་པ� ོ།</span></p><p class="paragraph"><span class="size5">༢་ ཁྱེད་ཀྱིས་ཇི་ཐོས་པ་དེ་ལྟར་� བྲི་དགོས་ཤིང་། ཁྱེད་ཀྱིས་ཐོས་པ་དེ་ཁོ་ན་ལས་གཞན་མིན། སྐད་ཆ་ཡིག་ཐོག་� བེབས་
སྐབས་མི་སུས་ཇི་ལྟར་བཤད་པ་དེ་ལྟར་ཡིག་གེར་ཕབ་དགོས། དེ་ཡང་དཔེར་ན། ཨོང་་་་་་་་་་་་་ ཨཱ་་་་་་་་་� ོང་་་་་་་ལགས་སོ་ལ་
སོགས་པ་ཡང་ཚུད་ཡོད། དེ་ལས་ལྡོག་སྟེ་ཁྱེད་ཀྱིས་སྐད་ཆ� ི་ནང་མི་གསལ་བ� ི་ཕྲད་ལ་སོགས་པ� ང་སྣོན་མི་ཆོག །
</span></p><p class="paragraph"><span style="color: yellow;"> MISSING TIBETAN see principle 3 in English!!!
!!Read First!!
This section contains proposals that have not been fully evaluated and approved. The following guidelines are subject to further refinement and change:
MISSING TIBETAN whole section </span>
</p><h3 class="heading-h3"><a name="ChineseLoanwords" class="anchorpoint"></a>Chinese Loanwords</h3><p class="paragraph">If you encounter a Chinese loanword in your transcript, attempt to spell the word in Chinese. Follow this word with the Tibetan equivalent in parentheses. For example:</p><p class="paragraph"><span class="size5">
ཏ་ཞོལ༼སློབ་གྲྭ་ཆེན་པོ༽
</span></p><p class="paragraph"><span style="color: yellow;">MISSING TIBETAN – whole section</span>
</p><h3 class="heading-h3"><a name="ContinuationofPreviousUtterance" class="anchorpoint"></a>Continuation of Previous Utterance</h3><p class="paragraph">In some cases, speaker <em class="italic">Ka</em> may split an utterance over two turns. We propose to code this by using a series of <em class="italic">tshegs</em> at the beginning of the speaker's second utterance:</p><p class="paragraph"><span class="size5">
ཀ། དེ་རིང་ང་ཚོ་་་་་</span></p><p class="paragraph"><span class="size5">ཁ། ལགས།</span></p><p class="paragraph"><span class="size5">ཀ། ་་་་་ལྷ་ས་ལ་� གྲོ་གི་ཡིན།</span></p><p class="paragraph"><span class="size5">ཀ། དེ་རིང་ང་ཚོ་་་་་</span></p><p class="paragraph"><span class="size5">ཁ། ལགས།</span></p><p class="paragraph"><span class="size5">ཀ། ་་་་་ལྷ་ས་ལ་� གྲོ་གི་ཡིན།</span></p><p class="paragraph">
Note that unlike "overlap" (for which, see below), here <em class="italic">Ka</em> and <em class="italic">Kha</em> are speaking in turn. There is a pause after <em class="italic">Ka</em>'s first utterance, and <em class="italic">Kha</em> speaks in cooperation with <em class="italic">Ka</em>.</p><p class="paragraph"><span style="color: yellow;">
MISSING TIBETAN - whole section</span>
</p><h3 class="heading-h3"><a name="SpeechErrors" class="anchorpoint"></a>Speech Errors</h3><p class="paragraph">Speakers often make mistakes, for example mispronouncing or mischoosing words in sometimes embarrassing ways. We do not correct their speech in our transcriptions. Instead, we simply note down what speakers say, as they say it. If the mistake is so severe that the speaker's meaning is impossible to determine without a hint, transcribers may follow the mistake with the target word in brackets.</p><p class="paragraph"><span style="color: yellow;">MISSING TIBETAN whole section
</span>
</p><h3 class="heading-h2"><a name="ListofTopicsspanstylecoloryellowShouldthisgoatthetopspan" class="anchorpoint"></a>List of Topics <span style="color: yellow;">Should this go at the top??</span></h3><p class="paragraph"><span class="size5">
� གོ་བརྗོད་རེ� ུ་མིག
</span>
</p><h3 class="heading-h3"><a name="Interruptions" class="anchorpoint"></a>Interruptions </h3><p class="paragraph">If one speaker interrupts another speaker, thus preventing the first speaker from completing his utterance, then do not fail to type the first speaker's partial utterance. Instead of ending the partial utterance with a <em class="italic">shad</em>, end it with a series of <em class="italic">tsheg</em>s.</p><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">ཀ � ོང་ཁ་སང་པཱ་ལགས་་་་་་་</span></p><p class="paragraph"><span class="size5">ཁ � ོང་� ོང་རེད་རེད་ཧ་གོ་སོང་།
</span>
<span class="size5">
</span></p><h3 class="heading-h2"><a name="བརཆད" class="anchorpoint"></a>བར་ཆད། </h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">གལ་ཏེ་སྨྲ་བ་པོ་གཅིག་གིས་སྨྲ་བ་པོ་གཞན་ཞིག་གི་སྐད་ཆར་བར་གཅོད་བྱས་ཚེ་སྨྲ་བ་པོ་དང་པོ་གང་ཡིན་པ་དེ� ི་
རྗོད་པ� ི་ཆ་ཤས་� གོད་མཚམས་བཞག་སྟེ་རྣམ་ཀུན་ཆིག་ཤད་ཀྱི་དོད་དུ་ཚེགས་དྲུག་བྲིས་ཏེ་དེ་ཚུལ་མཚོན་པར་བྱེད་དགོས།</span></p><p class="paragraph"><span class="size5">དཔེར་ན།</span></p><p class="paragraph"><span class="size5">ཀ � ོང་ཀ་སང་པཱ་ལགས་་་་་་</span></p><p class="paragraph"><span class="size5">ཁ � ོང་� ོང་རེད་རེད་ཧ་གོ་སོང་།</span></p><p class="paragraph">
</p><h3 class="heading-h3"><a name="Misstarts" class="anchorpoint"></a>Misstarts</h3><p class="paragraph">A misstart occurs when a speaker starts to say something, then stops, and then continues or says something else. In cases of mis-start, type the first part of the speaker's utterance, followed by a space, and then the second part of his utterance. (To get a space in THDL Extended Wylie, type '_'.)</p><p class="paragraph">An example from the video <em class="italic">Phurdron with her Dad</em>:</p><p class="paragraph"><span class="size5">
ཀ � ོང་ཁ་སེང་པཱ་ལགས་- - - པཱ་ལགས་ཁྱེད་རང་བཞུགས་མེད་དུས་ཙམ་པར་ཟླ་སྒྲོན་� དིར་སླེབས་སོང་ང་ལགས།</span></p><p class="paragraph"><span class="size5">ཀ � ོང་� ོང་རེད་རེད་� བྲེལ་བ་མང་ཙམ་བྱེད་ཕར་ཚུར།
</span>
<span class="size5">
</span></p><h3 class="heading-h2"><a name="གཚགསཟསསན" class="anchorpoint"></a>� གོ་ཚུགས་ཟློས་སྐྱོན། </h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">� གོ་ཚུགས་ཟློས་སྐྱོན་ཞེས་པ་ནི་སྨྲ་བ་པོ་ཞིག་གིས་སྐད་ཆ་ཚིག་� ག� ་བཤད་དེ་མཚམས་བཞག་རྗེས་མུ་
མཐུད་སྐད་ཆ� ི་� ཕྲོ་མཐུད་པ� མ་སྐད་ཆ་གཞན་ཞིག་བཤད་པ་ལ་ཟེར། � གོ་ཚུགས་ཀྱི་ཟློས་སྐྱོན་དེ་དག་ལ་དཔེ་བཤུ་མཁན་
གྱིས་ཚེག་གསུམ་གྱིས་བར་ཆོད་པར་བྱས་ཏེ་སྐད་ཆ� ི་ཆ་ཤས་གཉིས་པ་དེ་མུ་མཐུད་དེ་� གོད་དགོས།</span></p><p class="paragraph">An example from the video <em class="italic">Phurdron with her Dad</em>:
<span class="size5">
དཔེར་ན། ཕུར་སྒྲོན་དང་ཁོ་མ� ི་ཕ་ཞེས་པ� ི་བརྙན་ཕབ་ལས།</span></p><p class="paragraph"><span class="size5">ཀ � ོང་ཁ་སེང་པཱ་ལགས་་་་པཱ་ལགས་ཁྱེད་རང་བཞུགས་མེད་དུས་ཙམ་པར་ཟླ་སྒྲོན་� དིར་སླེབས་སོང་ང་ལགས།</span></p><p class="paragraph"><span class="size5">ཀ � ོང་� ོང་རེད་རེད་� བྲེལ་བ་མང་ཙམ་བྱེད་ཕར་ཚུར།
</span>
</p><h3 class="heading-h3"><a name="Overlap" class="anchorpoint"></a>Overlap </h3><p class="paragraph">When two or more speakers' speech overlaps, try not to split a speaker's continuous sentence into two separate turns, interrupted by the other speaker's interjection. Instead, consider putting all of each speaker's utterance in a single speaker turn. Since we have direct and immediate access to audio and video files of the interaction, overlap need not be resolved in the transcript itself.</p><p class="paragraph"><span class="size5">
</span></p><h3 class="heading-h2"><a name="སལབཤད" class="anchorpoint"></a>སྣོལ་བཤད།</h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">སྐད་ཆ་ཤོད་མཁན་གཉིས་སམ་དེ་ལས་མང་བ� ི་སྣོལ་བཤད་ཀྱི་གནས་ཚུལ་བྱུང་སྟེ། སྐད་ཆ་ཤོད་མཁན་
གཞན་ཞིག་གིས་བར་གཅོད་བྱུང་བ� ི་ཚེ་སྐད་ཆ་ཤོད་མཁན་དང་པོ་དེ� ི་ཚིག་སྒྲུབ་དེ་ཁག་གཉིས་སུ་ཕྱེ་མི་རུང་། དེ� ི་དོད་དུ་སྐད་ཆ་ཤོད་མཁན་སོ་སོ� ི་རྗོད་པ་རྫོགས་པར་སྐྱེལ་དགོས།</span></p><p class="paragraph"><span class="size5">གང་ཡིན་ཟེར་ན་ངེད་ཚོར་ཐད་ཀ་ནས་དང་ལམ་སེང་སྒྲ་ཕབ་དང་བརྙན་ཕབ་ནང་གསལ་ཡིག་ཆར་ཕན་ཚུན་ཤུགས་རྐྱེན་ཐེབས་རེས་དང་། སྣོལ་བཤད་ཀྱིས་དཔེ་བཤུ་དེ་ཉིད་ལ་ཐག་གཅོད་བྱ་དགོས་མེད།
</span>
</p><h3 class="heading-h3"><a name="Pauses" class="anchorpoint"></a>Pauses</h3><p class="paragraph">Pauses should be graphically represented whenever they are longer than normal. Our convention is to represent long pauses as a series of <em class="italic">tsheg</em>s. Short pauses are coded with three <em class="italic">tsheg</em>s, medium-length pauses with six <em class="italic">tsheg</em>s, and long pauses with twelve <em class="italic">tsheg</em>s.</p><p class="paragraph"><span class="size5">
ཡག་པོ་བྱུང་་་ཟེར་གྱིས།</span></p><p class="paragraph"><span class="size5">ཡག་པོ་བྱུང་་་་་་ཟེར་གྱིས།</span></p><p class="paragraph"><span class="size5">ཡག་པོ་བྱུང་་་་་་་་་་་་ཟེར་གྱིས།
</span> <span class="size5">
</span></p><h3 class="heading-h2"><a name="དབགསམཚམསཇགཔ" class="anchorpoint"></a>དབུགས་མཚམས་� ཇོག་པ། </h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">དབུགས་མཚམས་� ཇོག་པ་དེས་ནམ་ཡིན་རུང་རྗོད་པ� ི་གདངས་སམ་སྐད་ཆ� ི་སྨྲ་ཚུལ་རྒྱུན་ལྡན་ལས་རིང་བ་ཞིག་ཡིན་པར་མཚོན་ཐུབ་པ་བྱེད་དགོས། ངེད་ཚོ� ི་ལམ་ལུགས་ལྟར་ན་དེ་ཚུལ་ཚེག་མང་ཉུང་གིས་མཚོན་པར་བྱེད་རྒྱུ་དེ་ཡིན། དེ་ཡང་དབུགས་མཚམས་� ཇོག་ཡུན་ཐུང་བར་ཚེག་གསུམ་དང་། དབུགས་མཚམས་� ཇོག་ཡུན་� བྲིང་གྲས་ལ་ཚེག་དྲུག དབུགས་མཚམས་� ཇོག་ཡུན་རིང་བར་ཚེག་བཅིུས་ཀྱིས་མཚོན་པར་བྱེད་དགོས།</span></p><p class="paragraph"><span class="size5">ཡག་པོ་བྱུང་་་ཟེར་གྱིས།</span></p><p class="paragraph"><span class="size5">ཡག་པོ་བྱུང་་་་་་ཟེར་གྱིས།</span></p><p class="paragraph"><span class="size5">ཡག་པོ་བྱུང་་་་་་་་་་་་ཟེར་གྱིས།</span></p><p class="paragraph">
</p><h3 class="heading-h3"><a name="ShadPunctuation" class="anchorpoint"></a>Shad Punctuation</h3><p class="paragraph">When the speaker successfully completes an utterance, follow that utterance with a <em class="italic">shad</em>, even if it is not a complete sentence. (Note: do not use <em class="italic">shad</em> if the speaker has been interrupted or if the speaker has mis-started.)</p><p class="paragraph"><span class="size5">
</span></p><h3 class="heading-h2"><a name="ཤདཀསར" class="anchorpoint"></a>ཤད་ཀྱི་སྐོར། </h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">སྐད་ཆ་ཤོད་མཁན་གྱིས་རྗོད་པ་ཆ་ཚང་བ་ཞིག་བཤད་གྲུབ་རྗེས་ཤད་ཅིག་དགོས་ལ་ཐ་ན་རྗོད་པ་ཆ་ཚང་བ་ཞིག་
མ་ཡིན་ཡང་ཤད་ཅིག་དགོས། ༼གལ་སྲིད་སྐད་ཆ་ཤོད་མཁན་དེ� ི་སྐད་ཆར་བར་གཅོད་བྱུང་བ� མ་� གོ་ཚུགས་ཟློས་སྐྱོན་བྱུང་ཚེ་ཤད་� བྲི་མི་རང།༽
</span>
</p><h3 class="heading-h3"><a name="SpeakerNamingConventions" class="anchorpoint"></a>Speaker Naming Conventions</h3><p class="paragraph">When naming speakers, do not include the honorific <em class="italic">lags</em>, except in special cases such as <em class="italic">pA lags</em> and the like. If the participant's name cannot be figured out or is irrelevant in the context, use general terms of address such as <em class="italic">cog lags</em> 'brother', <em class="italic">pho lags</em> 'grandfather', and the like. Valid speaker names include:</p><p class="paragraph"><span class="size5">
པཱ་ལགས་
ཕུར་སྒྲོན་
ཅོག
ཨ་ཅག
བཀྲ་ཤིས</span></p><p class="paragraph"> <span class="size5">
</span></p><h3 class="heading-h2"><a name="སདཆཤདམཁནགམངབལགས" class="anchorpoint"></a>སྐད་ཆ་ཤོད་མཁན་གྱི་མིང་� བྲི་ལུགས།</h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5"> སྐད་ཆ་ཤོད་མཁན་ཞིག་ལ་མིང་� དོགས་པ� ི་སྐབས་ཞེ་ས� ི་ཚིག་ལགས་སྤྱིར་
བཏང་མིང་དེ� ི་གྲུབ་ཆར་མ་ཚུད་པ་བྱེད་དགོས། པཱ་ལགས་ལྟ་བུར་དམིགས་བསལ་ཡིན། གལ་ཏེ་མིང་ཚིག་དེ� ི་ཚིག་རོགས་
རྐྱང་པས་དོན་སྟོན་མི་ནུས་པ� མ་ཡང་ན་དེ་དང་� བྲེལ་མེད་དོན་གཞན་དུ་� གྱུར་ན་སྤྱིར་བཏང་གི་མིང་ཚིག་དཔེར་ན། ཅོག་
ལགས། སྤོ་བོ་ལགས་ལྟ་བུ་རང་སོར་བཞག་དགོས། སྐད་ཆ་ཤོད་མཁན་གྱི་མིང་� ཐད་ལྡན་དུ་གཤམ་གསལ་གྱི་དཔེ་མཚོན་
� དྲ་བ་ཚུད་ཡོད།
པཱ་ལགས་
ཕུར་སྒྲོན་
ཅོག
ཨ་ཅག
བཀྲ་ཤིས
</span>
</p><h3 class="heading-h3"><a name="Spelling" class="anchorpoint"></a>Spelling</h3><p class="paragraph">The general idea of our spelling guidelines is to use literary spellings, except where spoken forms excessively diverge from literary forms. In such cases, the <span style="color: yellow;"> literary </span> form is given first, followed by the {Color: yellow} colloquial <span style=""> form in parentheses. For example:</span></p><p class="paragraph"><span class="size5"><span style="">
སྲན་མ༼ཀྲན་མ༽ </span></span></p><p class="paragraph"><span style="">A list of approved and rejected spellings is maintained as the Spelling Database. When considering a spelling, transcribers should first consult this list to see whether the proposed spelling has already been approved or rejected. The Spelling Database was created largely by applying the spelling rules found in the Spelling Guidelines document. </span><span style="color: blue;"></span><span style=""> Transcriber familiarity with this document is essential. </span>
If a spelling is not in the Spelling Database, the transcriber should then consult a dictionary. If the dictionary also fails to shed light on the matter, then he has no choice but to propose a potentially controversial spelling. Transcribers should mark; proposed spellings in their transcripts as follows:</p><p class="paragraph"><span class="size5">
༼༔མིན་� དུག༽ </span></p><p class="paragraph">This makes it easy to search for proposed spellings and replace them with approved spellings. In addition, transcribers should add their proposal to their Spelling Proposal file. For each proposed new spelling, transcribers keep track of the following fields in their Spelling Proposal document: Proposed Spelling, Rationale for Spelling, Definition in Tibetan, Chinese or English translation, rendering of the pronunciation of the word in Tibetan script, proposed transcription practice, literary root, example passage or sentence, and source (i.e. title of transcript).
Periodically, each transcriber's Spelling Proposal file is reviewed, and an <span style="color: yellow;"> authority makes </span> the necessary adjustments to the Spelling Database, which is then made available to transcribers.</p><p class="paragraph"><span class="size5">
</span></p><h3 class="heading-h2"><a name="དགཆསར" class="anchorpoint"></a>དག་ཆ� ི་སྐོར།</h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">ངེད་ཚོ� ི་དག་ཆ� ི་ལམ་སྟོན་ནམ་ཕྱོགས་སྟོན་གྱི་བསམ་ཚུལ་ལྟར་ན་ཡིག་སྐད་བེད་སྤྱོད་བྱ་གྱུ་དེ་ཡིན་མོད་ཁ་
སྐད་ཀྱི་རྣམ་པ་དེ་ཡིག་སྐད་དང་ཁྱད་པར་ཆེན་པོ་ཡོད་པ� ི་ཆེ་ཁ་སྐད་ཐོག་མར་� གོད་དེ་གུག་རྟགས་ནང་ཡིག་སྐད་
� གོད་དགོས། དཔེར་ན།</span></p><p class="paragraph"><span class="size5">ཀྲན་མ༼སྲན་མ༽</span></p><p class="paragraph"><span class="size5"> དག་ཆ� ི་ནང་ངོས་ལེན་རུང་དང་མི་རུང་བ་གཉིས་ཀ་དག་ཆ� ི་ལས་གཞི� ི་རེ� ུ་མིག་ཅེས་པ� ི་ནང་དུ་ཉར་� ཚག་བྱེད་དགོས། དག་ཆ་ཞིག་ངོས་� ཛིན་པ� ི་ཚེ་དཔེ་བཤུ་མཁན་གྱིས་རེ� ུ་མིག་དེ་ཉིད་ལ་བལྟས་ཏེ་དག་ཆ་དེ་ངོས་ལེན་རང་དང་མི་རུང་གི་སྐོར་གཏན་� ཁེལ་ཡོད་མིན་ངོས་� ཛིན་དགོས། དག་ཆ� ི་ལས་གཞི� ི་རེ� ུ་མིག་དེ་དག་ཆ� ི་ལམ་སྟོན་ཡིག་ཆ� ི་ནང་གི་དག་ཆ� ི་� གྲོ་ལུགས་ནང་ཁ་སྣོན་� ོས་སྦྱོར་བྱས་ཏེ་རྒྱ་ཆེར་གསར་སྐྲུན་བྱེད་དགོས།</span></p><p class="paragraph"><span class="size5"> གལ་ཏེ་དག་ཆ་གང་ཞིག་དག་ཆ� ི་ལས་གཞི� ི་རེ� ུ་མིག་དེ� ི་ནང་མེད་ཚེ་དཔེ་བཤུ་མཁན་གྱིས་ཚིག་མཛོས་ཅིག་ལ་
བསྟེན་དགོས། གལ་ཏེ་ཚིག་མཛོད་ཀྱིས་ཀྱང་གོ་མ་ཆོད་ཚེ་དག་ཆ་གསར་པ་ཕན་ནུས་ལྡན་ལ་རྒྱུ་མཚན་ཅན་ཞིག་� ོས་སྦྱོར་བྱེད་
དགོས། དེ་ཚུལ་དཔེ་བཤུ་མཁན་གྱིས་རྟགས་ཤིག་བརྒྱབ་ཏེ་མཚོན་པར་བྱེད་དགོས། � ོས་སྦྱོར་གྱི་དག་ཆ་རྣམས་དཔེ་བཤུ� ི་
ཡིག་ཆ� ི་ནང་གཤམ་གསལ་ལྟར་� གོད་དགོས།</span></p><p class="paragraph"><span class="size5">༼༔མིན་� དུག༽</span></p><p class="paragraph"><span class="size5"> རྟགས་� དིས་� ོས་སྦྱོར་གྱི་དག་ཆ་རྣམས་ཐུན་མོང་དུ་ཁས་ལེན་པ� ི་དག་ཆ་རྣམས་ཚབ་ཏུ་� གོད་ཡོད་པ་ལས་སླ་པོར་བཙལ་རྙེད་ཐུབ། གཞན་ཡང་། དཔེ་བཤུ་མཁན་ཚོས་རང་རང་གི་བསམ་� ཆར་རྣམས་དག་ཆ� ི་བསམ་� ཆར་ཡིག་ཆ� ི་ནང་ཁ་སྣོན་བྱེད་དགོས། � ོས་སྦྱོར་བྱས་པི་དག་ཆ་གསར་པ་རེ་རེ་བཞིན་དཔེ་བཤུ་མཁན་གྱིས་གཤམ་གསལ་ཁྱབ་ཁོངས་ནང་གི་རང་རང་གི་དག་ཆ� ི་བསམ་� ཆར་ཡིག་ཆ� ི་ནང་དུ་ཤུལ་དེད་གཏོང་རྒྱུ་རྒྱུན་� ཁྱོངས་བྱེད་དགོས། དག་ཆ� ི་བསམ་� ཆར། དག་ཆ་རྒྱུ་མཚན་ཅན་དུ་� གོད་པ། བོད་ཡིན་ནང་དུ་ངེས་གཏན་ཅན་དུ་� གྱུར་བ། རྒྱ་ཡིག་དང་དབྱིན་ཡིག་གི་ཡིག་སྒྱུར། སྒྲ་སྒྱུར་གྱི་ཚིག་རྣམས་བོད་ཡིག་ཡིག་གཟུགས་ཀྱིས་� གོད་དགོས། དཔེ་བཤུ� ི་ལས་བྱར་བསམ་� ཆར་ཕུལ་བ། ཡིག་སྐད་ཀྱི་རྩ་བ། དུམ་མཚམས་དང་། ཚིག་གྲུབ དེ་བཞིན་� བྱུང་ཁུངས་བཅས་ཀྱི་དཔེ་མཚོན། ༔དཔེར་ན་དཔེ་བཤུ� ི་ཁ་བྱང་ལྟ་བུ།༔</span></p><p class="paragraph"><span class="size5"> དུས་དུས་སུ་དཔེ་བཤུ་མཁན་གྱི་དག་ཆ� ི་བསམ་� ཆར་ཡིག་ཆར་བསྐྱར་ཞིབ་དང། དགོས་དབང་ལ་བལྟོས་ནས་
དག་ཆ� ི་ལས་གཞི� ི་རེ� ུ་མིག་དེ་� ོས་སྒྲིག་བྱེད་རྒྱུ� ི་དབང་ཆ་སྤྲོད་དགོས། ཚུལ་དེས་དཔེ་བཤུ་མཁན་ལ་ཕན་ཐོགས་ངེས་ཅན་
� ོང་ངེས།</span></p><p class="paragraph">
</p><h3 class="heading-h3"><a name="TimeCoding" class="anchorpoint"></a>Time Coding</h3><p class="paragraph">The QuillDriver software allows time codes to be inserted at any level of granularity. At one extreme, time codes could delimit each clause. At the other extreme, they could delimit each page of text. Our guidelines for granularity of time coding depend on the type of material being transcribed as well as the way the material will be used.
Throughout, our time coding guidelines are to insert both Start and Stop times for each <span style="color: blue;"> block </span>that is time coded (i.e. by pressing <span class="key">Ctrl-]</span> in QuillDriver rather than <span class="key">Ctrl-[</span> ).</p><p class="paragraph"><span class="size5">
</span></p><h3 class="heading-h2"><a name="དསཚདཚདབཀགགསསལ" class="anchorpoint"></a>དུས་ཚོད་ཚད་བཀག་གོ་སྤྱི་སྲོལ། </h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">སྒྲོ་སྨྱུག་ཁ་ལོ� ི་མཉེན་ཆས་ཀྱིས་དུས་ཚོད་ཚད་བཀག་དེ་� བྲུ་གཟུགས་ཀྱི་ཆ་ཚད་གང་� དྲ་ཞིག་གི་ནང་དུ� ང་� ཛུད་ཐུབ། ༔རྗོད་པ� ི་མཐ� ་གཅིག་ནས་དུས་ཚོད་ཚད་བཀག་གིས་ཚིག་གྲུབ་རེ་རེ་བཞིན་གྱི་དུས་ཚོད་ཚོད་� ཛིན་བྱེད་ཐུབ། མཐ� ་གཞན་ཞིག་ནས་དུས་ཚོད་ཚད་བཀག་གིས་ཤོག་ལྷེ་རེ་རེ� ི་ངོས་ཀྱི་དུས་ཚོད་ཚོད་� ཛིན་བྱེད་ཐུབ། ངེད་ཚོ� ི་ཕྱོགས་སྟོན་དེ་དུས་ཚོད་ཚད་བཀག་གི་� བྲུ་གཟུགས་མཛུབ་སྣོན་བྱ་རྒྱུ� ི་དཔེ་བཤུ� ི་ཡིག་ཆར་བརྟེན་དགོས་པ� ི་ཆེད་དུ་ཡིན་པ་ཙམ་མ་ཟད་བེད་སྤྱོད་བྱ་� གྱུར་གྱི་ཡིག་ཆར་ཡང་བརྟེན་དགོས་ཆེད་དུ� ང་ངོ། །</span></p><p class="paragraph"><span class="size5"> ངེད་ཚོ� ི་དུས་ཚོད་ཚད་བཀག་གི་ལམ་སྟོན་ནང་རྗོད་པ� མ་ཚིག་རྐང་རེ་རེ་བཞིན་གྱི་� གོ་� ཛུགས་དང་མཚམས་� ཇོག་གཉིས་ཀར་དུས་ཚོད་ཚད་བཀག་བྱེད་དགོས། ༔དེ་ཚུལ་སྒྲོ་སྨྱུག་ཁ་ལོ� ི་ནག་དུ་དཔེ་བཤུ་བྱེད་སྐབས་གློག་ཀླད་ངོས་ཀྱི་
</span><span class="key"><span class="size5">Ctrl-]</span></span><span class="size5"> ལ་མཛུབ་སྣོན་བྱས་ན་ </span><span class="key"><span class="size5">Ctrl-[</span></span><span class="size5"> ལ་མཛུན་སྣོན་བྱས་པ་ལས་ལོས་ལེགས།༔
</span>
</p><h3 class="heading-h3"><a name="Colloquialconversations" class="anchorpoint"></a>Colloquial conversations</h3><p class="paragraph">For such materials, we generally time code each clause separately. Usually, there is enough of a pause between clauses to make this possible. For example, in MST 36, the following lines are timecoded separately:</p><p class="paragraph"><span class="size5">
སྐོལ་ལྡན་ཞིམ་པོ་དང་ཚ་པོ་ཅིག་གནང་བྱུང་།</span></p><p class="paragraph"><span class="size5">ད་དུུང་ད་ལོ་སྐོལ་ལྡན་ནང་ལ་ཕྱུ་ར་དང་བུ་རམ་ཞེ་དྲག་བསྐྱོན་བཞག
</span></p><p class="paragraph">There is a noticeable pause after <em class="italic">byung</em>, which enables a time code to be placed there. In some cases, the decision to time code a series of clauses or phrases as one or more separate segments depends on whether or not there is any pause to hold the time code. For example, the following line, also from MST 36, although splitable in theory after <em class="italic">bkra shis bde legs</em>, was kept as one line in practice because there was virtually no pause after <em class="italic">bde legs</em>:</p><p class="paragraph"><span class="size5">
བཀྲ་ཤིས་བདེ་ལེགས། སྐུ་ཁམས་བཟང་།
</span></p><p class="paragraph">It may sometimes make sense in colloquial conversations to enclose two speakers' turns together within a single set of time codes. For example, if person A is saying <em class="italic">'ong 'ong 'ong</em> throughout person B's utterance, it may make more sense to time code A and B's utterances together rather than to give A's utterance a separate set of time codes.</p><p class="paragraph"><span class="size5">
</span></p><h3 class="heading-h2"><a name="ཁསདཀགངམལ" class="anchorpoint"></a>ཁ་སྐད་ཀྱི་གླེང་མོལ། </h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5"> ཁ་སྐད་� དྲ་བ� ི་རྒྱུ་ཆ་རྣམས་ལ་ང་ཚོས་སྤྱིར་བཏང་རྗོད་པ་སོ་སོར་དུས་ཚོད་ཚད་བཀག་བྱེད་ཀྱི་ཡོད། རྟག་པར་རྗོད་པ་སོ་སོ� ི་བར་ལ་དབུགས་མཚམས་� ཇོག་ཡུན་� དང་ངེས་ཡོད། དཔེར་ན། MST 36 ནང་གཤམ་གསལ་གྱི་
ཚིག་གྲུབ་ལ་དུས་ཚོད་ཚད་བཀག་སོ་སོར་བྱས་ཡོད།</span></p><p class="paragraph"><span class="size5">སྐོལ་ལྡན་ཞིན་པོ་དང་ཚ་པོ་ཅིག་གནང་བྱུང་།</span></p><p class="paragraph"><span class="size5">ད་དུང་ད་ལོ་སྐོལ་ལྡན་ནང་ལ་ཕྱུ་ར་དང་བུ་རམ་ཞེ་དྲག་བསྐྱོན་བཞག</span></p><p class="paragraph"><span class="size5"> དབུགས་མཚམས་� ཇོག་ཚུལ་ཐད་བྱུང་ཞེས་པ་ལྟ་བུ� ི་རྗེས་སུ་དུས་ཚོད་ཚད་བཀག་བྱེད་དགོས། གནས་ཚུལ་མི་� དྲ་བར་བལྟོས་ཏེ་རྗོད་པ་དང་། ཚིག་ཚོགས། དེ་བཞིན་དེ་ལས་མང་བ� ི་གཅོད་མཚམས་རྣམས་ལ་དུས་ཚོད་ཚད་བཀག་བྱེདསྐབས་དབུགས་མཚམས་བཞག་ཡོད་ཡིན་ལ་བལྟོས་དགོས། དཔེར་ན་གཤམ་གསལ་གྱི་ཡིག་ཕྲེང་གཅིག་༔ཚིག་གྲུབ༔དེ� ང་MST 36ལས་བྱུང་ཞིང་སྤྱིར་བཏང་གི་� གྲོ་ལུགས་ལྟར་ན། བཀྲ་ཤིས་བདེ་ལེགས།ཞེས་པ� ི་རྗེས་སུ་གཅོད་མཚམས་ཤིག་དགོས་མོད་� དིར་ཡིག་ཕྲེང་གཅིག་གམ་ཚིག་གྲུབ་གཅིག་གི་དོད་དུ་སྤྱད་ཡོད། གང་ལགས་ཤེ་ན། � དིར་བདེ་ལེགས་ཞེས་པ� ི་རྗེས་སུ་དབུགས་མཚམས་བཞག་མེད་པས་སོ།</span></p><p class="paragraph"><span class="size5">བཀྲ་ཤིས་བདེ་ལེགས། སྐུ་ཁམས་བཟང་།</span></p><p class="paragraph"><span class="size5"> སྐབས་རེ་ཁ་སྐད་ནང་སྐད་ཆ་ཤོད་མཁན་གཉིས་མཉམ་དུ་དུས་ཚོད་ཚད་བཀག་གཅིག་གི་ནང་དུ་� ཛུད་ཡོད། དེ་ཚུལ་དཔེར་ན། གལ་ཏེ་ཀ་པས། � ོང་། � ོང་། � ོང་། ཞེས་ཁ་པ� ི་ངག་གམ་རྗོད་པ� ི་བར་དུ་ཤོས་ཀྱིན་ཡོད་པས་དེ་ལྟ་བུ� ི་གནས་ཚུལ་བྱུང་ཚེ་ཀ་པ་དང་ཁ་པ� ི་དུས་ཚོད་ཚད་བཀག་མཉམ་དུ་བྱེད་པ་ཁོ་ན་ལེགས་པར་མཐོང་གིས་ཁྲལ་ཏེ་སོ་སོར་ཚད་བཀག་བྱེད་པ་མི་ལེགས་སོ། །
</span>
</p><h3 class="heading-h3"><a name="Lectures" class="anchorpoint"></a>Lectures</h3><p class="paragraph">In the case of lectures, one may want to limit time coding to every "paragraph" of the transcript. <span style="color: yellow;"> For non-colloquial speech lesson videos, time codes should delimit paragraphs no longer than three to four sentences in length.</span></p><p class="paragraph"><span class="size5">
</span></p><h3 class="heading-h2"><a name="གཏམབཤད" class="anchorpoint"></a>གཏམ་བཤད། </h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">གཏམ་བཤད་ཀྱི་གནས་ཚུལ་ལ་སེམས་ན། དཔེ་བཤུ་མཁན་གྱིས་དཔེ་བཤུ� ི་དུམ་མཚམས་སོ་སོར་
དུས་ཚོད་ཚད་བཀག་བྱས་ན་� ོས།</span></p><p class="paragraph">
</p><h3 class="heading-h3"><a name="Interviews" class="anchorpoint"></a>Interviews</h3><p class="paragraph">For interviews, either (a) questions and answers should be time coded together, as a unit; or (b) questions should be time coded separately from answers, and answers should be time coded at the paragraph level. (a) is only feasible if both question and answer are relatively short.</p><p class="paragraph"><span class="size5">
</span></p><h3 class="heading-h2"><a name="ངམཇལགངམལ" class="anchorpoint"></a>ངོ་མཇལ་གླེང་མོལ། </h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">ཀ་ངོ་མཇལ་གླེང་མོལ་གྱི་དྲི་བ་དང་ལན་གཉིས་ཀྱི་དུས་ཚོད་ཚད་བཀག་མཉམ་དུ་བྱེད་རྒྱུ་དེ་
ཚད་གཞི་ཞིག་ཏུ་� ཇོག་དགོས། ཁ་ཡང་ན། དྲི་བ་དེ་དྲི་ལན་ལས་སོགས་སུ་དུས་ཚོད་ཚད་བཀག་བྱེད་དགོས་ཤིང་། དྲི་ལན་དེ་
དུམ་མཚམས་རང་བཞིན་གྱི་དུས་ཚོད་ཚད་བཀག་བྱེད་དགོས། ཀ་ཡི་ཚུལ་དེ་དྲི་བ་དང་དྲི་ལན་གཉིས་ཀ་ཐུང་ཐུང་ཡིན་པར་བལྟོས་� ཇོག་གིས་བཞག་ཆོག་གོ།
</span>
</p><h3 class="heading-h3"><a name="Songs" class="anchorpoint"></a>Songs</h3><p class="paragraph">If possible, each line of a song should be time coded separately. If this is not possible given the flow of the song, then each verse should be time coded separately.</p><p class="paragraph"><span class="size5">
</span></p><h3 class="heading-h2"><a name="གཞས" class="anchorpoint"></a>གཞས། </h3><p class="paragraph"><span class="size5">
བྱུང་ན་གཞས་ཀྱི་ཚིག་རྐང་རེ་རེ་བཞིན་དུས་ཚོད་ཚད་བཀག་བྱེད་དགོས། གལ་ཏེ་དེ་ལྟར་མ་བྱུང་ཚེ་གཞས་
ཀྱི་རྒྱུན་ཡོངས་སུ་རྫོགས་པར་དུས་ཚོད་ཚད་བཀག་གཅིག་བཟོས་རྗེས་གཟོད་རྐང་རེ་རེ་བཞིན་ཁྲལ་ཏེ་དུས་ཚོད་ཚད་བཀག་བྱེད་དགོས།
</span>
</p><h3 class="heading-h3"><a name="Uncertainty" class="anchorpoint"></a>Uncertainty</h3><p class="paragraph">Sometimes you can't hear clearly what's being said, which means that you either have to make a guess, or just leave an empty space in the transcription. Such cases must be clearly marked, to alert readers and subsequent transcribers to the transcription difficulty. If you have no guess as to what's being said, you should put a series of <em class="italic">tshegs</em> inside parentheses, as in the first example below. If you have a guess, then precede and follow your guess by a series of <em class="italic">tshegs</em>, and enclose the whole in parentheses, as in the second example:</p><p class="paragraph"><span class="size5">
ཡག་པོ་༼་་་་་༽བྱུང་ཟེར་གྱིས།</span></p><p class="paragraph"><span class="size5">ཡག་པོ་༼་་་་ཞེ་པོ་་་་་༽བྱུང་ཟེར་གྱིས།</span></p><p class="paragraph"> <span class="size5">
</span></p><h3 class="heading-h2"><a name="སམཉརངབཞནཅན" class="anchorpoint"></a>སོམ་ཉི� ི་རང་བཞིན་ཅན། </h3><p class="paragraph"><span class="size5"></span></p><p class="paragraph"><span class="size5">སྐབས་རེ་ཁྱེད་ཀྱིས་ཇི་ཞིག་ཤོད་ཀྱིན་ཡོད་མིན་གསལ་པོ་མི་ཐོས། དེ་དོན་ནི་ཀྱིས་ཚོད་དཔག་བྱ་རྒྱུར་རག་ལུས་ཡོད།</span></p><p class="paragraph"><span class="size5">ཡག་པོ་༼་་་་༽བྱུང་ཟེར་གྱིས།</span></p><p class="paragraph"><span class="size5">ཡག་པོ་༼་་་་ཞེ་པོ་་་་༽བྱུང་ཟེར་གྱིས།
</span>
</p><h3 class="heading-h6"><a name="ProvidedforunrestrictedusebythespanclassnobrimgsrcsakairwikitoolimagesicklearrowgifaltexternallinktitleexternallinkahrefhttpwwwthdlorgtargetrwikiexternalTibetanandHimalayanDigitalLibraryaspan" class="anchorpoint"></a><em class="italic">Provided for unrestricted use by the <span class="nobr"><img src="/" alt="external link: " title="external link"/><a href="http://www.thdl.org" target="rwikiexternal">Tibetan and Himalayan Digital Library</a></span></em></h3><p class="paragraph">
</p>